Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Experimental
Psicología
NOVENA EDICIÓN
Barry. H. Kantowitz
Universidad de Michigan
David G. Elmes
Universidad de Washington y Lee
Margaret Chamberlain-Gastón
en
CONTENIDOS EN BREVE
viii
CONTENIDO
Fuentes de conocimiento 6
Fijación de la creencia 6
Conexiones web 23
Reactividad 30
El estudio de caso 31
Investigación de encuestas 32
El enfoque relacional 36
Investigación de contingencias 36
Investigación correlacional 38
El coeficiente de correlación 38
ix
Resumen 48
Términos clave 49
Preguntas de discusión 49
Conexiones web 50
Recurso de laboratorio 50
Cuasi-Experimentos 71
Datos 77
Obtención de datos 77
Análisis de datos 78
Informe de datos 78
Resumen 79
Términos clave 80
Preguntas de discusión 81
Conexiones web 81
Fraude científi co 92
Lecturas sugeridas 97
Problemas en la percepción
181 Percepción directa e indirecta
181 Conciencia y percepción 183
Introducción de las variables 186 7.1
Temas experimentales e ilustraciones de investigación
Informe verbal: Percepción sin conciencia 187 7.2
Temas experimentales e ilustraciones de investigación
Operaciones convergentes: Percepción sin conciencia y percepción con conciencia explícita 196
Del problema al experimento: las tuercas y los tornillos
La ilusión de distancia de color 201
Resumen 204
Términos clave 205
Preguntas de discusión 205
Conexiones web 205
miden la atención 222 Resumen 225 Términos clave 225 Preguntas de discusión 225
Conexiones web 226
Resumen 257
Términos clave 258
Preguntas de discusión 258
Conexiones web 259
Resumen 323
Términos clave 323
Preguntas de discusión 324
Conexiones web 325
e ilustraciones de investigación
Cuasi-Experimentos: Ruido y Rendimiento Cognitivo 401
Resumen 446
Términos clave 447
Conexiones web 447
Tabla E
Valores críticos de t 503
Tabla F
Valores críticos de la distribución F 504
Tabla G
Valores críticos de la 2 Distribución 508
Tabla H
números aleatorios 509
REFERENCIAS 511
GLOSARIO 528
PREFACIO
xix
Debemos notar un punto acerca de los términos en nuestro libro. En 1994, el Manual de
publicación de la Asociación Estadounidense de Psicología recomendó que el término tradicional
sujetos, que se había utilizado durante más de un siglo para referirse a las personas que fueron
evaluadas en la investigación psicológica, se cambiara por participantes. Este cambio recibió una
reacción mixta en la comunidad de investigación, y algunas otras organizaciones que publican
revistas de psicología no estuvieron de acuerdo. Por ejemplo, la Psychonomic Society permite el
uso de cualquier término en artículos publicados en sus revistas. Además, los correctores de estilo
de las revistas de la Asociación Americana de Psicología no insisten en que los participantes se
utilicen como el término preferido, sino que fomentan su uso. Debido a que la situación no está
resuelta, hemos seguido la convención de utilizar tanto sujetos como participantes cuando nos
referimos a personas en la investigación psicológica. Tendemos a usar sujetos cuando nos
referimos a animales no humanos en la investigación, pero usamos ambos términos cuando nos
referimos a humanos. Por lo tanto, el uso en nuestro texto refleja la práctica actual en el campo
en general.
La filosofía del texto permanece invariable. Al igual que con las primeras ocho ediciones, nos
hemos esforzado por lograr un tratamiento integrado de la psicología experimental con una
metodología y un contenido que unen los vínculos sin fisuras. El libro incluye dos partes principales.
Los primeros cinco capítulos constituyen la Parte Uno, Fundamentos de la Investigación, y
discuten algunos preliminares metodológicos básicos que necesitan los estudiantes. En estos
capítulos describimos algunos aspectos generales de la ciencia y la construcción de teorías; las
características de (y las diferencias entre) los métodos observacionales, correlacionales y
experimentales (con énfasis en el último); cuestiones éticas en la investigación; y cómo leer y
escribir informes de investigación.
En los diez capítulos restantes, que componen la segunda parte, Principios y prácticas de la
investigación, desarrollamos los aspectos básicos proporcionados en la primera parte al ilustrar
temas metodológicos en el contexto de problemas reales de investigación. Los capítulos cuentan
con títulos de contenido (por ejemplo, Percepción), y parte del contenido se cubre por derecho
propio, pero el objetivo principal de los capítulos es presentar temas metodológicos en el contexto
de la investigación real. Esta organización refleja nuestra creencia de que la mejor manera de
proporcionar a los estudiantes una comprensión de la metodología es integrarla en el contexto de
los problemas reales que ocurren al realizar una investigación. La metodología no existe en el
vacío, sino que se concibe para resolver problemas concretos de investigación. Esperamos que presen
Todos los capítulos de la segunda parte comparten un formato común. Esta estructura paralela debería ayudar a
orientar a los estudiantes hacia las características importantes del texto que facilitan el aprendizaje.
Apertura del capítulo Los capítulos comienzan con un bosquejo y una cita. Después de una breve orientación
sobre el área de contenido explorada en el capítulo, el estudiante se encontrará con el primero de varios insertos
en el recuadro, que los lectores de las ediciones anteriores han encontrado útiles y que, por lo tanto, se han
trasladado a la novena edición.
Introducción a las variables Esta función orienta rápidamente al estudiante hacia las variables independientes,
dependientes y de control que se usan comúnmente en áreas de investigación particulares.
Nuestra cobertura de estas variables no agota las posibilidades, pero incluye algunas de las más comunes.
Temas experimentales e ilustraciones de investigación Esta característica representa la parte principal del
capítulo, en la que se presentan dos o tres cuestiones metodológicas en el contexto de un problema de
investigación real. Así, por ejemplo, en el capítulo 10 discutimos la dificultad de los efectos techo y suelo en el
contexto de un experimento de memoria en el que realmente surgió este problema. Muchos de estos temas
experimentales se han presentado en la Parte Uno y se tratan con más detalle en la Parte Dos. Algunos temas
cruciales se tratan más de una vez en la segunda parte para garantizar una mejor comprensión. Los temas de
contenido se eligieron como buenos vehículos para discutir el punto metodológico particular bajo consideración.
Por lo tanto, los temas de contenido pueden no representar los temas más importantes del tema en discusión, ni
pretendemos que nuestros capítulos representen un resumen completo del trabajo contemporáneo en el área.
Nuestra intención es ilustrar cuestiones de métodos en el contexto de problemas reales de investigación que son
de interés. Otras dos características únicas aparecen hacia el final de cada capítulo en la Parte Dos.
Del problema al experimento: las tuercas y los tornillos En esta sección, presentamos la lógica detrás de las
decisiones de diseño experimental (cuántos sujetos deben usarse, por qué se selecciona la variable X en lugar
de la variable Y, etc.) cuando las hipótesis se toman de una base general. forma a las especificidades de un
experimento. Estas decisiones son los “elementos básicos” de la investigación experimental. Son una segunda
naturaleza para los experimentadores en ejercicio y, por lo tanto, rara vez se articulan en artículos de revistas,
pero pueden representar acertijos para quienes son nuevos en la investigación.
Psicología en acción Esta característica sugiere demostraciones experimentales seguras y sencillas que
requieren poco o ningún equipo y que se pueden usar dentro o fuera de clase. Por ejemplo, el Capítulo 7 incluye
una demostración del efecto Stroop y el Capítulo 14 presenta métodos para medir los efectos del ruido en la
memoria.
Características al final del capítulo Finalmente, cada capítulo contiene un resumen en el que se revisan los
puntos principales del capítulo, un conjunto de términos clave para revisión y estudio, y varias preguntas de
discusión.
Aunque a los estudiantes les resultará más útil leer la Parte Uno en el orden de serie correcto
(especialmente los primeros tres capítulos), aquellos profesores y estudiantes más interesados en la
metodología que en el contenido pueden ignorar los números de capítulo de la Parte Dos. La tabla que
cruza los números de los capítulos y los temas experimentales (que se encuentra después del Prefacio)
se puede usar para determinar el orden en que se asignan los capítulos en la Parte Dos. Así, el instructor
tiene la opción de seguir un orden más o menos tradicional o de crear un orden único más adecuado a
sus objetivos educativos. Dos capítulos menos utilizados que, sin embargo, pueden ser bastante
necesarios para algunos, se encuentran en los apéndices. El Apéndice A proporciona un breve bosquejo
de la historia de la psicología experimental, y el Apéndice B contiene una revisión de las estadísticas
básicas.
Accesorios
El Manual del instructor con recursos del banco de pruebas para instructores incluye resúmenes de
capítulos, términos clave, respuestas a preguntas de debate, sugerencias para conferencias, sugerencias
para demostraciones y "dilemas experimentales". El banco de pruebas contiene preguntas de opción
múltiple, verdadero-falso y ensayo para cada capítulo. El banco de pruebas también está disponible
electrónicamente en el formato ExamView® para que los instructores creen sus propias pruebas/respuestas.
Transparencias electrónicas Muchas de las figuras del texto están disponibles como diapositivas de
Power Point® que se pueden descargar y usar en el salón de clases.
Los usuarios de la edición anterior descubrirán muchos cambios en la edición actual. Las referencias web
se han actualizado para todos los capítulos; mientras estos estaban funcionando en enero de 2008,
algunos sin duda cambiarán durante la vida de esta edición. Estas referencias guían a los lectores a
discusiones relevantes en línea, incluido Wadsworth Online en The Wadsworth Psychology Study Center.
Además, los instructores en América del Norte que han especificado que InfoTrac College Edition se
empaquete con este texto han recibido 4 meses de acceso gratuito a esta extensa biblioteca virtual para
sus estudiantes.
Se ha agregado nueva cobertura y referencias más recientes en cada capítulo, y algunos capítulos
se han reconstruido para reflejar los hallazgos y temas más recientes.
ÿ AGRADECIMIENTOS
Se necesitan muchas más personas que autores para crear un texto que ha durado nueve ediciones, y
los autores se complacen en reconocer con gratitud la ayuda de muchos otros. Nuestra mayor deuda es
con los lectores de ediciones anteriores que continúan ofreciendo muchos comentarios útiles. Sin sus
útiles sugerencias, esta nueva edición no existiría.
Mila Sugovic brindó una excelente ayuda editorial, especialmente con el trabajo de arte en los
Capítulos 2, 7 y 9, y Keith Lyle y Jane McConnell brindaron una valiosa ayuda en la preparación y revisión
del manuscrito, entre otras cosas, y les agradecemos a todos. También agradecemos a Erik Evans,
Rebecca Rosenberg y Pat Waldo de Cengage y Carol O'Connell de Graphic World Publishing Services
por sus importantes esfuerzos para guiar nuestro libro a través del proceso de producción.
Nos gustaría agradecer a los siguientes revisores, quienes brindaron sus comentarios para
ayudarnos con esta revisión: Jeffrey M. Zacks, Universidad de Washington; Sandra Sego, Colegio
Internacional Americano; Hallie Stephens, Universidad Estatal del Sureste de Oklahoma; y Paul Thuras,
Universidad St. Mary de Minnesota.
ORGANIZACIÓN
DEL LIBRO
Temas Experimentales 6 7 8 9 10 11 12 13 14 15
confuso X
operaciones convergentes X
contrapeso X
Características de la demanda X
Cuestiones éticas X
controles experimentales/
variables extrañas X X
Tema de investigación X X
Generalización de resultados X X
Efectos de interacción X X
Escalas de medida X
Definición operacional X X
cuasi-experimentos X
Artefactos de regresión X
Atenuación de escala X
Diseño de n pequeña X X X
Informe verbal X X
PARTE 1
FUNDAMENTOS
DE INVESTIGACIÓN
UNA
Explicación en Psicología Científica
DOS
Técnicas de Investigación: Observación y Correlación
TRES
Técnicas de Investigación: Experimentos
CUATRO
Ética en la Investigación Psicológica
CINCO
Cómo leer y escribir informes de investigación
11
CAPÍTULO 1
EXPLICACIÓN
EN CIENTÍFICO
PSICOLOGÍA
la Teoría a la Hipótesis
Evaluación de Teorías
Variables Intervinientes
Zorros y Erizos Deambulando por la Teoría Psicológica LA
CIENCIA DE LA PSICOLOGÍA
Psicología y el mundo real
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
El objetivo de la psicología científi ca es comprender por qué las personas piensan y actúan
como lo hacen. A diferencia de los no científicos, que se basan en fuentes de conocimiento
informales y secundarias, los psicólogos utilizan una variedad de técnicas bien desarrolladas para
recopilar información y desarrollar explicaciones teóricas. Como un ejemplo de este enfoque
científi co de la comprensión, considere el siguiente estudio de caso del proceso de investigación.
Social Loafi de
Una observación común, una que probablemente hayas hecho tú mismo en muchas ocasiones:
es que las personas que trabajan en un grupo a menudo parecen "permitirse" en su esfuerzo.
Muchas personas en grupos parecen dispuestas a dejar que unos pocos hagan el trabajo. Bibb
Latané, psicólogo social, notó esta tendencia y decidió estudiarla experimentalmente. Inicialmente,
Latané examinó la literatura de investigación en busca de evidencia de este fenómeno de personas
que trabajan menos en grupos, al que denominó holgazanería social. Uno de los primeros
estudios sobre la holgazanería social fue realizado por un ingeniero agrónomo francés (Ringelmann,
1913; Kravitz y Martin, 1986) que pidió a la gente que tirara de una cuerda lo más fuerte que
pudiera. Los sujetos tiraban solos o con uno, dos o siete más. Se utilizó un indicador sensible para
medir la fuerza con la que tiraban de la cuerda. Si las personas ejercen la misma cantidad de
esfuerzo en grupos que cuando están solas, entonces el desempeño del grupo debe ser la suma
de los esfuerzos de todos los individuos. Ringelmann descubrió que los grupos de dos tiraban solo
al 95 por ciento de su capacidad, y los grupos de tres y ocho se hundían al 85 por ciento y al 49
por ciento, respectivamente. Entonces, probablemente no sea solo nuestra imaginación cuando
notamos que otros (¿y nosotros mismos?) parecen hacer menos esfuerzo cuando trabajan en
grupos: la investigación de Ringelmann nos brinda un buen ejemplo de holgazanería social.
Latané y sus colegas realizaron una serie sistemática de experimentos sobre el fenómeno de
la holgazanería social (Latané, 1981; Latané, Williams y Harkins, 1979). Primero demostraron que
el fenómeno podía obtenerse en otras situaciones experimentales además de la de tirar de la
cuerda. También demostraron que la holgazanería social ocurre en varias culturas diferentes
(Gabrenya, Latané y Wang, 1983) e incluso es válida para los niños pequeños. Por lo tanto, la
holgazanería social parece ser una característica generalizada del trabajo en grupo.
Un posible beneficio de tal investigación básica sobre un fenómeno es que los hallazgos pueden
aplicarse más adelante para resolver algún problema práctico. Un gran problema en la sociedad
estadounidense es la dificultad de mantener alta la productividad de los trabajadores. Aunque la
holgazanería social es, en el mejor de los casos, sólo un factor involucrado en este complicado asunto,
Marriott (1949) mostró que los trabajadores de fábricas que trabajan en grandes grupos producen
menos por individuo que los que trabajan en pequeños grupos. Por lo tanto, la investigación básica que
mostraría una forma de superar el problema de la holgazanería social puede ser de gran importancia
práctica. De hecho, Williams, Harkins y Latané (1981) encontraron condiciones que eliminaban el efecto
de la holgazanería social. Cuando el desempeño individual (en lugar del desempeño de todo el grupo)
podía ser monitoreado dentro de la situación del grupo, los individuos trabajaban tan duro como lo
hacían cuando trabajaban solos. Sin duda, se debe realizar más investigación, pero puede ser que
simplemente medir el desempeño individual en situaciones grupales podría ayudar a eliminar la
holgazanería social y aumentar la productividad. La solución propuesta puede parecer simple, pero en
muchos trabajos solo se mide el desempeño del grupo y se ignora el desempeño individual.
Hemos discutido los estudios de Latané sobre la holgazanería social como un ejemplo de
investigación psicológica para ilustrar cómo un problema interesante puede llevarse a un entorno de
laboratorio y estudiarse de manera controlada. Los experimentos realizados, cuando se realicen con
cuidado, promoverán una mejor comprensión del fenómeno de interés que la simple observación de
eventos y la reflexión sobre ellos. Este libro trata en gran parte sobre la realización adecuada de tales
estudios experimentales: cómo desarrollar hipótesis, organizar las condiciones experimentales para
probar las hipótesis, recopilar observaciones (datos) dentro de un experimento y luego analizar e
interpretar los datos recopilados. En resumen, en este libro tratamos de cubrir los fundamentos de la
investigación científica aplicada a la psicología.
Antes de examinar las especificidades de la investigación, discutiremos algunos temas generales
en el resto de este capítulo. La investigación sobre la holgazanería social se utiliza para ilustrar varios
aspectos de la ciencia psicológica: sus propósitos, sus fuentes y su naturaleza.
ÿ FUENTES DE CONOCIMIENTO
Fijación de la creencia
El método científi co es una forma válida de adquirir conocimiento sobre el mundo que nos rodea.
¿Qué características del enfoque científi co lo convierten en una forma deseable de aprender y llegar a
creencias sobre la naturaleza de las cosas? Quizá la mejor forma de responder a esta pregunta sea
contrastar la ciencia con otros modos de fijar las creencias, ya que la ciencia es solo una de las formas en
que se forman las creencias.
Hace más de cien años, el filósofo estadounidense Charles Sanders Peirce (1877) comparó la forma
científica de conocer con otros tres métodos para desarrollar creencias. Llamó a éstos la autoridad, la
tenacidad y los métodos a priori .
Según Peirce, la forma más sencilla de fijar la creencia es confiar en la palabra de otra persona. Una
autoridad de confianza te dice lo que es verdad y lo que es falso. Los niños pequeños creen lo que sus
padres les dicen simplemente porque mamá y papá siempre tienen razón. A medida que los niños crecen,
pueden descubrir, por desgracia, que mamá y papá no siempre tienen razón cuando se trata de astrofísica,
macroeconomía, tecnología informática y otros campos especializados del conocimiento. Aunque esto puede
hacer que los niños duden de algunas de las proclamaciones anteriores de sus padres, puede que no resulte
en un rechazo total de este método de fijación de creencias. En cambio, se puede buscar alguna otra
autoridad.
Las creencias religiosas se forman por el método de la autoridad. Mucho después de que los niños
católicos hayan rechazado a sus padres como la fuente de todo conocimiento, particularmente sobre la
doctrina religiosa, es posible que todavía crean que el Papa es infalible. Creer las noticias que ves en la
televisión significa que aceptas a la CNN o a alguna otra red de noticias como una autoridad.
Puedes creer a tus profesores porque son autoridades. Dado que las personas carecen de los recursos para
investigar todo lo que aprenden, muchos conocimientos y muchas creencias se fijan mediante el método de
la autoridad. Siempre que no suceda nada que suscite dudas sobre la
El tercer método no científico discutido por Peirce fija la creencia a priori. En este contexto, el
término a priori se refiere a algo que se cree sin previo estudio o examen. Las proposiciones que parecen
razonables se creen. Esta es una extensión del método de autoridad. Sin embargo, no hay una autoridad
en particular que se siga ciegamente en este método. La perspectiva cultural general es lo que parece
fijar la creencia a priori.
La gente alguna vez creyó que el mundo era plano, y parecía razonable suponer que el sol giraba
alrededor de la tierra como lo hace la luna. De hecho, el mundo parece plano si no estás en una nave
espacial.
Los métodos de tenacidad y a priori son similares en el sentido de que minimizan la posibilidad de
ser influenciados por opiniones en conflicto. En el método de la tenacidad se descartan por completo
otros puntos de vista, aunque advertidos. Así, se conserva un estereotipo racial a pesar de otras
evidencias, como las buenas cualidades de una persona de diferente raza que vive en la casa de al lado.
En el método a priori , otros puntos de vista pasan desapercibidos. Por ejemplo, la vista de un barco que
desaparece de abajo hacia arriba, en lugar de todo a la vez, cuando sale del puerto puede parecer
irrelevante si ya sabes que el mundo es plano.
El último de los métodos de Peirce, el método científico, fija la creencia sobre la base de la
experiencia. La ciencia se basa en la suposición de que los eventos tienen causas y que podemos
descubrir esas causas a través de la observación controlada. Esta creencia de que las causas
observables determinan los eventos se conoce como determinismo. Si definimos la psicología científi
ca (así como la ciencia en general) como una tarea repetible que se corrige a sí misma y que busca
comprender los fenómenos sobre la base de la observación empírica, entonces podemos ver varias
ventajas del método científi co sobre los métodos que se acaban de describir. esbozado. Veamos qué
entendemos por empírico y autocorrectivo y examinemos las ventajas asociadas con esos aspectos
de la ciencia.
La primera ventaja del método científico es su énfasis en la observación empírica.
Ninguno de esos otros métodos se basa en datos (observaciones del mundo) obtenidos por observación
sistemática. En otras palabras, no existe una base empírica para fijar la creencia. La palabra empírico se
deriva de una antigua palabra griega que significa “experiencia”. Tener una base empírica para las
creencias significa que la experiencia, más que la fe, es la fuente del conocimiento. Tener las propias
creencias fijadas por la autoridad no garantiza que la autoridad haya obtenido datos antes de formarse
una opinión. Por definición, el método de la tenacidad se niega a considerar datos, como lo hace el
método a priori . Los hechos que se consideran en estos otros modos de fijar la creencia no se obtienen
ordinariamente por procedimientos sistemáticos. Por ejemplo, la observación casual fue el “método” que
condujo a las ideas de que el mundo era plano y que las ranas se generaban espontáneamente del barro
cada primavera, como creía Aristóteles.
La segunda ventaja de la ciencia es que ofrece procedimientos para establecer la superioridad de
una creencia sobre otra. Las personas que tienen diferentes creencias encontrarán difícil
Inducción y Deducción
Ciertos elementos básicos son compartidos por todos los enfoques de la ciencia. Los más importantes
son los datos (observaciones empíricas) y la teoría (organización de conceptos que permiten la
predicción de datos). La ciencia necesita y usa tanto datos como teoría, y nuestro esquema de
investigación sobre holgazanería social indica que pueden estar interrelacionados de una manera
compleja. Sin embargo, en la historia de la ciencia, los científicos individuales han diferido sobre cuál
es más importante y cuál viene primero. Tratar de decidir esto es un poco como tratar de decidir si el
huevo o la gallina es lo primero. La ciencia intenta comprender por qué las cosas funcionan de la forma
en que lo hacen y, como argumentaremos, la comprensión implica tanto datos como teoría.
Aunque Bacon reconoció la importancia tanto de los datos como de la teoría, creía en la primacía
de las observaciones empíricas; los científicos modernos también enfatizan los datos y ven el progreso
en la ciencia como un trabajo de datos a teoría. Tal enfoque es un ejemplo de inducción, en el que el
razonamiento procede de datos particulares a una teoría general.
El enfoque inverso, que hace hincapié en la teoría que predice los datos, se denomina deducción;
aquí, el razonamiento procede de una teoría general a datos particulares (Figura 1.1). Debido a que
muchos científicos y filósofos de la ciencia han defendido la primacía de una forma de razonamiento
sobre la otra, examinaremos la inducción y la deducción con cierto detalle.
Debido a que las observaciones empíricas distinguen a la ciencia de otros modos de fijar creencias,
muchos han argumentado que la inducción debe ser la forma en que la ciencia debería funcionar.
Como lo afirma Harré (1983), “se dice que las observaciones y los resultados de los experimentos son
'datos', que proporcionan una base sólida y sólida para la erección del frágil edificio del pensamiento cien
Inducción Deducción
DATOS
ÿ FIGURA 1.1
Una teoría organiza y predice datos. Por medio de la deducción, se pueden predecir
observaciones particulares (datos). Por inducción, los datos sugieren principios organizadores
(teorías). Esta relación circular indica que las teorías son imágenes tentativas de cómo se
organizan los datos.
(pág. 6). En el caso de la holgazanería social, el argumento sería que los hechos de la holgazanería
social derivados de la experimentación produjeron la teoría de la difusión de la responsabilidad.
Un problema con un enfoque puramente inductivo tiene que ver con la finalidad de las observaciones
empíricas. Las observaciones científi cas están ligadas a las circunstancias en las que se realizan, lo
que significa que las leyes o teorías que se derivan de ellas también deben tener un alcance limitado.
Los experimentos subsiguientes en diferentes contextos pueden sugerir otra teoría o modificaciones a
una existente, por lo que nuestras teorías que se inducen sobre la base de observaciones particulares
pueden (y generalmente lo hacen) cambiar cuando se realizan otras observaciones. Esto, por supuesto,
es un problema solo si uno adopta una visión autoritaria de las ideas y cree en aferrarse tenazmente a
una teoría particular.
Por lo tanto, las teorías inducidas a partir de las observaciones son ideas tentativas, no verdades
definitivas, y los cambios teóricos que ocurren como resultado del trabajo empírico continuo ejemplifican
la naturaleza de autocorrección de la ciencia.
De acuerdo con la visión deductiva, que enfatiza la primacía de la teoría, el aspecto científico
importante de la investigación de la holgazanería social es la guía empírica provista por la teoría formal
de la holgazanería social. Además, la teoría más general, la difusión de la responsabilidad, proporciona
una comprensión de la holgazanería social. El enfoque deductivo tiene en alta estima las teorías bien
desarrolladas. Las observaciones casuales, las teorías informales y los datos ocupan un lugar
secundario frente a las teorías amplias que describen y predicen un número considerable de
observaciones.
Desde el punto de vista del enfoque deductivo, la comprensión científica significa, en parte, que
una teoría predecirá que deben ocurrir ciertos tipos de observaciones empíricas. En el caso de la
holgazanería social, la teoría de la difusión de la responsabilidad sugiere que monitorear el desempeño
individual en un grupo debería reducir la difusión de la responsabilidad, lo que a su vez reducirá la
cantidad de holgazanería social que se observa. Esta predicción, como hemos visto, resulta ser correcta.
Pero, ¿qué revelan las predicciones correctas? Si una teoría se verifica mediante los resultados
de los experimentos, un científico deductivo podría haber aumentado la confianza en la veracidad de la
teoría. Sin embargo, dado que las observaciones empíricas no son definitivas y pueden cambiar, algo
más que la verificación puede ser esencial para aceptar o rechazar una teoría. Corchete
Proctor y Capaldi (2001) han señalado dos tipos de objeciones al enfoque de Popper. Primero,
hay un problema lógico (Salmon, 1988). Dado que una teoría siempre puede ser potencialmente
refutada por el próximo experimento, el número de experimentos realizados consistentes con la teoría
es irrelevante. Entonces, lógicamente, una teoría bien elaborada no es más valiosa y no necesariamente
hace mejores predicciones que una teoría que nunca ha sido probada. Esta visión lógica entra en
conflicto con la visión práctica de que los científicos tienden a sentirse más cómodos con teorías que
han pasado varias pruebas experimentales.
Esta visión práctica (Kuhn, 1970) es lo que Proctor y Capaldi (2001) ofrecen como la segunda
objeción empírica a la falsificación: las teorías tienden a ser aceptadas, al menos inicialmente, sobre
la base de su capacidad para explicar (organizar) fenómenos existentes más que en su capacidad
para predecir nuevos resultados.
Un problema con el enfoque deductivo tiene que ver con las propias teorías.
La mayoría de las teorías incluyen muchas suposiciones sobre el mundo que son difíciles de probar y
que pueden estar equivocadas. En el trabajo de Latané, una suposición que subyace a la teoría
general es que medir el comportamiento de una persona en un contexto experimental no cambia el
comportamiento en cuestión. Aunque a menudo esto es una suposición razonable, mostraremos más
adelante que las personas pueden reaccionar de manera inusual al ser observadas, lo que significa
que esta suposición a veces es incorrecta. Si las suposiciones no probadas son incorrectas, entonces
un experimento particular que falsea una teoría puede haberla falseado por las razones equivocadas.
Es decir, la prueba de la teoría puede no haber sido justa o apropiada. Se puede concluir, por tanto,
que el enfoque deductivo por sí solo no puede conducir a la comprensión científi ca.
En este punto, puede que te estés preguntando si la comprensión científi ca es posible si tanto la
inducción como la deducción no son infalibles. No se desesperen. La ciencia se corrige a sí misma y
puede proporcionar respuestas a los problemas, por muy temporales que sean esas respuestas. La
comprensión científica cambia a medida que los científicos ejercen su oficio. Tenemos una mejor
comprensión de la holgazanería social ahora que antes de que Latané y sus compañeros de trabajo
emprendieran su investigación. A través de una combinación de inducción y deducción (ver Figura
1.1), la ciencia avanza hacia una comprensión más profunda de sus problemas.
De la teoría a la hipótesis
Las teorías no se pueden probar directamente. No existe un solo experimento mágico que demuestre que
una teoría es correcta o incorrecta. En cambio, los científicos realizan experimentos para probar hipótesis
que se derivan de una teoría. Pero, ¿qué son exactamente las hipótesis científicas y de dónde vienen?
Es importante distinguir entre hipótesis y generalizaciones (Kluger & Tikochinsky, 2001). Una
hipótesis es una declaración comprobable muy específica que se puede evaluar a partir de datos
observables. Por ejemplo, podríamos plantear la hipótesis de que los conductores mayores de sesenta y
cinco años tendrían una mayor frecuencia de accidentes relacionados con giros a la izquierda en el tráfico
que se aproxima cuando conducen de noche que los conductores más jóvenes. Al observar los registros
policiales de datos de accidentes, pudimos determinar, con la ayuda de algunas estadísticas (consulte el
Apéndice B), si esta hipótesis es incorrecta. Una generalización es una declaración más amplia que no
se puede probar directamente. Por ejemplo, podríamos generalizar que los conductores mayores son
peligrosos a cualquier velocidad y deberían tener restricciones, como no poder conducir de noche, en su
licencia de conducir. Dado que "inseguro a cualquier velocidad" no está claramente definido, esta no es
una declaración comprobable. De manera similar, la generalización no defi ne un rango de edad para los
conductores mayores. Sin embargo, se puede utilizar para derivar varias hipótesis comprobables.
Sin embargo, la mayoría de los psicólogos prefieren probar hipótesis basadas en la teoría. En este caso, la
generalización se forma deductivamente (ver Figura 1.1) a partir de la teoría. La generalización del impulsor del
envejecimiento también podría derivarse de las teorías de la atención, la percepción y la toma de decisiones
(Kantowitz, 2001). A medida que envejecemos, nuestra capacidad para atender múltiples tareas disminuye y
nuestra toma de decisiones se vuelve más conservadora, lo que a menudo requiere más tiempo para llevar a
cabo. Por lo tanto, un conductor de edad avanzada podría (a) tener problemas para ver el tráfico que se aproxima
por la noche, (b) tener problemas para prestar atención al tráfico que se aproxima mientras presta atención a la
radio o a un pasajero, y (c) tomar mucho tiempo para decidir si una izquierda. -girar con la mano a través del tráfico e
Teoría
Experiencia cotidiana
ÿ FIGURA 1.2
Evaluación de teorías
El científico sofisticado no trata de determinar si una teoría en particular es verdadera o falsa en un
sentido absoluto. No existe un enfoque en blanco y negro para la evaluación de la teoría. Se puede
saber que una teoría es incorrecta en alguna parte y, sin embargo, continuar usándose. En la física
moderna, la luz se representa, según la teoría elegida, como partículas discretas llamadas cuantos o
como ondas continuas. Lógicamente, la luz no puede ser ambas cosas al mismo tiempo. Por lo tanto,
podría pensar que al menos uno de estos dos puntos de vista teóricos debe ser necesariamente falso.
El físico tolera esta ambigüedad (aunque quizás no del todo) y utiliza cualquier representación —
cuántica u onda— que sea más apropiada.
En lugar de afirmar rotundamente que una teoría es verdadera, es mucho más probable que el científico
afirme que está respaldada sustancialmente por datos, dejando así abierta la posibilidad de que los
nuevos datos no respalden la teoría. Aunque los científicos no afirman que una teoría es verdadera, a
menudo deben decidir cuál de varias teorías es la mejor. Como se señaló anteriormente, las
explicaciones son provisionales; sin embargo, el científico todavía necesita decidir qué teoría es la
mejor por ahora. Para hacerlo, se necesitan criterios explícitos para evaluar una teoría. Cuatro de estos
criterios son la parsimonia, la precisión, la comprobabilidad y la capacidad de ajustar los datos.
Un criterio importante se insinuó anteriormente cuando afirmamos que cuantos menos enunciados
hay en una teoría, mejor es la teoría. Este criterio se llama parsimonia, oa veces la navaja de Occam,
en honor a Guillermo de Occam. Si una teoría necesita un enunciado separado para cada resultado
que debe explicar, es evidente que la teoría no ha ganado ninguna economía. Las teorías ganan poder
cuando pueden explicar muchos resultados con pocos conceptos explicativos. Así, si dos teorías tienen
el mismo número de conceptos, la que puede
Finalmente, una teoría debe ajustarse a los datos que explica. Si bien la bondad de ajuste no
es un criterio sufi ciente para aceptar una teoría (Roberts y Pashler, 2000), tiene poco sentido seguir
una teoría que no se ajuste a los datos (Rodgers y Rowe, 2002).
Variables Intervinientes
Las teorías a menudo usan construcciones que resumen los efectos de varias variables. Las variables
se analizan con más detalle en el Capítulo 3. Por ahora, describiremos brevemente dos tipos
diferentes de variables. Las variables independientes son aquellas manipuladas por el experimentador.
Por ejemplo, no permitir que las ratas tomen agua durante varias horas crearía una variable
independiente llamada horas de privación. Las variables dependientes son las observadas por el
experimentador. Por ejemplo, se podría observar cuánta agua bebe una rata.
La ciencia trata de explicar el mundo relacionando variables independientes y dependientes.
Las variables intermedias son conceptos abstractos que vinculan variables independientes con
variables dependientes. La gravedad es una construcción familiar que logra este objetivo. Puede
relacionar una variable independiente, los pies de altura desde la que se deja caer un objeto, con una
variable dependiente, la velocidad del objeto cuando golpea el suelo. La gravedad también resume
los efectos de la altura sobre la velocidad para todo tipo de objetos. La gravedad explica la caída de
manzanas así como la caída de pelotas de béisbol. La ciencia progresa cuando una sola construcción,
como la gravedad, explica los resultados en muchos entornos diferentes.
Miller (1959) ha explicado cómo una sola variable interviniente, la sed, organiza eficientemente
los resultados experimentales. La figura 1.3 muestra una forma directa e indirecta de relacionar una
variable independiente, horas de privación, con una variable dependiente, tasa de barra
ÿ FIGURA 1.3
Un conjunto de variables.
prensado. La variable dependiente se obtiene colocando una rata en una pequeña cámara donde puede
presionar una barra para obtener agua potable. El experimentador observa la velocidad (cuántas pulsaciones
por minuto) a la que la rata presiona la barra para obtener agua. La relación directa usa solo una flecha para
vincular las horas de privación con la tasa de presión de la barra.
Después de hacer el experimento, podríamos construir una fórmula matemática que relacione directamente
las horas de privación con la tasa de presión de la barra. El método indirecto de la figura 1.3 utiliza dos
flechas. La primera flecha relaciona las horas de privación con la sed, una variable interviniente.
La segunda flecha relaciona la variable intermedia, la sed, con la tasa de presión de la barra.
Dado que el método indirecto es más complicado y requiere una flecha adicional, es de esperar que el
científico prefiera el método directo de explicación. De hecho, si el único objetivo científico fuera relacionar
las horas de privación con la tasa de presión de la barra, estaría en lo cierto porque la ciencia prefiere
explicaciones simples a explicaciones complejas. Sin embargo, como explicaremos, el objetivo científico es
más general.
La figura 1.4 relaciona dos variables independientes, las horas de privación y la alimentación con
alimentos secos, con dos variables dependientes, la tasa de presión de la barra y el volumen de agua bebido.
Nuevamente, se muestran explicaciones tanto directas como indirectas. En la figura 1.4, las explicaciones
directas e indirectas son igualmente complejas. Cada uno requiere cuatro flechas distintas.
Sed
ÿ FIGURA 1.4
ÿ FIGURA 1.5
La figura 1.5 relaciona tres variables independientes, horas de privación, alimentación con alimento seco
e inyección de solución salina (darle agua salada a una rata a través de un tubo insertado en su estómago), con
tres variables dependientes, tasa de presión de la barra, volumen de agua bebido y cantidad de agua. quinina
necesaria para que la rata deje de beber. De nuevo, se muestran explicaciones tanto directas como indirectas.
Ahora, es obvio que el método indirecto es menos complicado.
Requiere seis flechas distintas, mientras que el método directo requiere nueve flechas. Así que a medida que la
ciencia trata de relacionar más variables independientes y dependientes, las variables intermedias se vuelven
más eficientes.
Hay otra ventaja más de las variables que intervienen. La sed, independientemente de cómo se produzca,
debería tener el mismo efecto en todas las variables dependientes. Esto se puede comprobar en experimentos.
Si no es cierto, podemos rechazar la idea de una sola variable interviniente.
Los capítulos posteriores analizan este problema bajo el tema de las operaciones convergentes.
1890) que intentó una explicación unificada de los fenómenos psicológicos. Este es el camino del erizo
que sabe una gran cosa (ver Figura 1.6).
Ambos enfoques enfrentan importantes desafíos. El enfoque dominante construye fuertes barreras
entre los campos. Los profesores son contratados dentro de un campo y tienden a tener oficinas
ubicadas por campo de especialización, para defenderse mejor de los ataques territoriales de otros
subcampos. Los estudiantes de posgrado se capacitan por campo, con los requisitos de cursos
apropiados, y esto perpetúa la división. Incluso los paneles que evalúan las propuestas de subvenciones
están organizados por especialidades. El nuevo doctorado. Quien acepta un trabajo en la industria está
mal preparado para la cooperación entre campos necesaria para resolver cualquier problema práctico import
Recientemente, ha crecido la simpatía por un enfoque más unificado (erizo) de la psicología
(Sternberg, Grigorenko y Kalmar, 2001). Estos teóricos tratan de entrelazar teorías en competencia,
enfatizando que el rol explicativo de la teoría es más crucial que el rol predictivo. El tejido teórico es un
objetivo digno si se puede lograr.
Sin embargo, el actual sistema dividido surgió porque las teorías integradas anteriores no pudieron
abarcar todos los subcampos de la psicología. ¿Los nuevos erizos tejerán mejor que los viejos?
ÿ LA CIENCIA DE LA PSICOLOGÍA
Algunos estudiantes encuentran difícil pensar en la psicología como una ciencia en el mismo sentido en
que la física y la química son ciencias. Creen que hay aspectos de la experiencia humana, como las
artes, la literatura y la religión, que desafían el análisis científico. ¿Cómo se puede reducir a frías
ecuaciones científicas la belleza de una litografía de Klee, una sonata de Beethoven o una fotografía de
Cartier-Bresson? ¿Cómo se pueden captar de la forma objetiva y desinteresada que exige la ciencia los
tiernos sentimientos de un primer romance, la emoción de conducir un coche deportivo a 100 millas por
hora o la agonía de un equipo de fútbol derrotado?
Algunos psicólogos, conocidos como humanistas, responderían negativamente a estas preguntas.
Estos humanistas, en su mayoría psicólogos clínicos y de asesoramiento, afirman que es imposible
evaluar y probar objetivamente gran parte de los sentimientos y la experiencia humana mediante
métodos científicos tradicionales. Incluso los duros psicólogos experimentales de "instrumentos de metal"
¿Están los experimentos demasiado lejos de la vida real? Los estudiantes de psicología suelen
exigir un mayor nivel de relevancia en sus cursos de psicología de lo que esperan de otras ciencias. Los
estudiantes que no están en absoluto consternados porque su curso de introducción a la física no les
permitió reparar su automóvil, a menudo se sienten perturbados porque su curso de introducción a la
psicología no les dio una mejor comprensión de sus propias motivaciones, no curó sus neurosis y fracasó.
para mostrarles cómo obtener la felicidad eterna. Si no encontró tal información en la psicología introductoria,
dudamos que la encuentre en este texto tampoco. Si esto te parece injusto, sigue leyendo.
Los datos que recopilan los psicólogos pueden parecer al principio sin importancia, porque puede ser
difícil establecer una relación inmediata entre la investigación psicológica básica y los problemas sociales
o personales apremiantes. Entonces, es natural dudar de la importancia de ciertos tipos de investigación y
preguntarse por qué el gobierno federal, a través de varias agencias, está financiando investigadores para
observar ratas empujando barras o corriendo por laberintos.
La dificultad, sin embargo, no está en la investigación, sino en las expectativas sobre cómo debe
llevarse a cabo una investigación “útil”. Como señaló Sidman (1960), la gente espera que se produzca un
progreso mediante el establecimiento de situaciones de laboratorio que sean análogas a las situaciones de
la vida real: “Para estudiar la psicosis en animales, debemos aprender a volverlos psicóticos”. Esto está
fuera de lugar. El psicólogo trata de comprender los procesos subyacentes más que las situaciones físicas
que producen estos procesos.
Las situaciones físicas en el mundo real y el laboratorio no tienen por qué ser similares, siempre que ocurran
los mismos procesos.
Supongamos que nos gustaría saber por qué ocurren los accidentes de avión o, más específicamente,
es decir, cuál es la relación entre los accidentes aéreos y la falta de atención por parte del piloto y/o del
controlador de tránsito aéreo. Un investigador básico podría abordar este problema haciendo que los
estudiantes de segundo año de la universidad se sienten frente a varias luces que se encienden en rápida
sucesión. El estudiante de segundo año tiene que presionar una tecla a medida que se ilumina cada luz.
Esto probablemente parece algo alejado de las colisiones en el aire de aeronaves. Sin embargo, aunque
las situaciones físicas son muy diferentes, los procesos son similares. Presionar una tecla es un índice de
atención (ver Capítulo 8). Los psicólogos pueden sobrecargar al operador humano presentando luces que
parpadean más rápido de lo que él o ella puede responder. Así, esta simple situación física en un laboratorio
permite al psicólogo estudiar la falta de atención en un ambiente cuidadosamente controlado. Además de
los beneficios de seguridad obvios de estudiar la atención sin tener que estrellar aviones, existen muchas
ventajas científicas para el entorno de laboratorio (consulte el Capítulo 3). Debido a que las fallas de atención
son responsables de muchos tipos de accidentes industriales (DeGreene, 1970, capítulos 7 y 15), los
estudios de atención mediante el uso de luces y botones pueden conducir a mejoras fuera del laboratorio.
Del mismo modo, establecer situaciones físicas similares no garantiza la similitud de los procesos.
Uno puede entrenar fácilmente a una rata para que recoja monedas en su boca y las entierre en su jaula.
Pero esto no significa necesariamente que la rata “avaro” y el humano avaro que guarda monedas debajo
de su colchón lo hagan porque los mismos procesos psicológicos controlan sus comportamientos.
No sólo deberíamos preocuparnos por los procesos psicológicos que pueden generalizarse del
laboratorio a una aplicación, sino también ser conscientes de dos razones importantes para hacer
investigación, cuyo propósito (al menos inicialmente) puede no estar directamente relacionado.
ÿ Resumen
1. La psicología científi ca se ocupa de los métodos y técnicas 3. Los científicos utilizan el razonamiento tanto inductivo como
utilizados para comprender por qué las personas piensan y deductivo para llegar a explicaciones del pensamiento y la acción.
actúan como lo hacen. Esta curiosidad puede ser satisfecha 4. Montones de generalizaciones producen hordas de
con investigación básica o aplicada, que por lo general van de hipótesis
la mano para brindar comprensión. 5. Una teoría organiza conjuntos de datos y genera pre
dicciones para nuevas situaciones en las que los datos no han
2. Nuestras creencias a menudo se establecen por el método de la sido obtenido. Una buena teoría es parsimoniosa, precisa,
autoridad, el método de la tenacidad o el método a priori. El comprobable y se ajusta a los datos que explica.
método científi co ofrece ventajas sobre estos otros métodos 6. La investigación de laboratorio se ocupa de los procesos que
porque se basa en la observación sistemática y se corrige a sí gobiernan la conducta y de mostrar las condiciones bajo las
mismo. cuales pueden observarse ciertos procesos psicológicos.
hipótesis teoría
ÿ PREGUNTAS DE DISCUSIÓN
1. Haz una lista de cinco afirmaciones que podrían considerarse 3. Discutir la investigación del ocio social desde el punto de vista de
verdaderas. Incluye algunas declaraciones controvertidas. la falsabilidad de la teoría.
(por ejemplo, los hombres tienen un coeficiente intelectual más 4. ¿Es necesario (o incluso deseable) que los psicólogos
bajo que las mujeres), así como algunas que está seguro de que experimentales justifiquen su investigación en términos de
son correctas. Encuesta a algunos de tus amigos preguntándoles beneficios aplicados a la sociedad?
si están de acuerdo con estas declaraciones. Luego, pídales que 5. Lea este artículo: Skinner, BF (1956). Una historia de caso en el
justifiquen sus opiniones. Clasifique sus justifi caciones en uno método científico. Psicólogo americano, 11, 221–233. Analice
de los métodos para fijar creencias discutidos en este capítulo. los puntos de vista de Skinner desde el punto de vista de los
2. Comparar y contrastar los enfoques inductivo y deductivo de la temas discutidos en este capítulo.
ciencia. Aclare sus respuestas refiriéndose a por lo menos una
rama de la ciencia fuera de la psicología experimental.
CONEXIONES WEB
Explore la presentación paso a paso de “¿Qué es la ciencia? Ways of Thinking about the World” sobre
las actividades del Centro de Recursos de Psicología de Wadsworth, Estadísticas y Métodos de Investigación
en: http://academic.cengage.com/psychology/workshops
http://www.cienciapsicológica.org
CAPÍTULO 2
INVESTIGAR
TÉCNICAS:
OBSERVACIÓN
Y
CORRELACIÓN
OBSERVACIÓN NATURALISTA
¿Qué observamos?
Reactividad
El estudio de caso
Investigación de encuestas
EL ENFOQUE RELACIONAL
Investigación de contingencias
Investigación correlacional
El coeficiente de correlación
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
cuantitativamente menos falible que la observación ordinaria. Más bien, se diferencia de la observación
cotidiana en que el científico descubre gradualmente sus errores anteriores y los corrige. .
. . De hecho, la historia de la psicología
La ciencia es quizás la única empresa intelectual que construye acumulativamente. Desde una
perspectiva científi ca, sabemos más sobre el mundo de hoy que lo que la gente ha sabido en
cualquier otro momento de la historia. Por otro lado, la literatura, el arte y la filosofía pueden ser
diferentes hoy de lo que eran en la antigua Grecia, pero probablemente no podemos decir que
estas disciplinas estén en un mejor estado o que representen con mayor precisión al mundo.
Una razón principal por la que la ciencia acumula es el hecho de que los científicos se
esfuerzan por lograr la observación más precisa posible del mundo. La ciencia se corrige a sí
misma en el sentido de que se presentan teorías e hipótesis que permiten predecir lo que debería
suceder en condiciones específicas, y luego estas ideas se prueban comparando las predicciones
con observaciones recopiladas cuidadosamente. Cuando los hechos difieren consistente y
drásticamente de las predicciones, es necesario modificar o abandonar nuestras concepciones
teóricas. Gran parte de la empresa científi ca se ocupa de la observación: la recopilación de
datos sobre algún aspecto particular del mundo.
En este capítulo, analizamos varios métodos no experimentales para recopilar datos
psicológicos. Uno de esos métodos es la observación naturalista, que es la forma más obvia y
quizás la más venerable de recopilar datos. Muchas personas, como los observadores de aves,
son naturalistas aficionados, pero los naturalistas científicos, como veremos, son más sistemáticos
en sus observaciones. Por ejemplo, los colibríes garganta azul machos tienen cantos que
consisten en notas organizadas en cinco unidades de canto; los machos en un área en particular
tienden a cantar las mismas unidades de canto (Ficken et al., 2000).
Otra forma de recopilar información es un estudio de caso, que generalmente implica el
examen detallado de un individuo, pero también puede implicar la comparación de un pequeño
número de individuos. Un caso reciente reveló que cuando KR, una madre de cuatro hijos de
treinta años, acudió a terapia, tenía varios rituales de conteo que obstaculizaban severamente
las actividades diarias (Oltmanns et al., 2006). Durante la compra de comestibles, por ejemplo,
KR creía que si seleccionaba uno de los cuatro artículos iniciales en un estante, uno de sus hijos
sufriría graves consecuencias. Ella creía que seleccionar la segunda caja de cereal resultaría en
un desastre para su segundo hijo, seleccionar la tercera caja dañaría a su tercer hijo, y así
sucesivamente.
Similar al estudio de caso es la encuesta. En lugar de un pequeño número de personas,
las encuestas recopilan información detallada y autoinformada de un gran número de personas.
Un ejemplo interesante de una muestra a gran escala es la Encuesta electoral nacional de
Annenberg de 2000 (Waldman, 2004), que se basa en entrevistas telefónicas detalladas de una
muestra aleatoria de 58.373 personas. En un análisis de una parte de los datos de la encuesta,
Moy, Xenos y Hess (2005) encontraron que la aparición de candidatos políticos en la televisión noc
ÿ OBSERVACIÓN NATURALISTA
Como todos sabemos, los observadores son falibles. Ver no debe ser creer, al menos no siempre. A
menudo, nuestras percepciones nos engañan, como se ve por la forma en que percibimos la ilusión óptica
en la Figura 2.1. Todos hemos visto a magos realizar hazañas aparentemente imposibles ante nuestros
ojos que sabíamos que se estaban logrando por medios naturales. tales trucos
(a)
(b)
1 2 3 4 5 6 7 8 9 10
ÿ FIGURA 2.1
Una Ilusión Visual. (a) La ilusión de Müller-Lyer. Las líneas verticales tienen la misma longitud
pero parecen desiguales debido a las diferentes direcciones de las aletas en los dos casos. (b) La
ilusión aparentemente distorsiona incluso un dispositivo de medición objetivo, la regla. Pero un
examen minucioso indica que la regla no está realmente distorsionada y que las líneas tienen la misma long
(Tomado de RL Gregory, 1970, págs. 80–81.)
Al hacer observaciones científicas, nos enfrentamos a dos problemas básicos que amenazan la
validez o solidez de las observaciones. (Estos problemas también pueden afectar a la experimentación, que
examinaremos más adelante.) Un problema tiene que ver con la delimitación de la elección de los
comportamientos a observar. Los observadores humanos tienen una capacidad finita para percibir y pensar
sobre los eventos. Aunque la mayoría de nosotros puede caminar y masticar chicle al mismo tiempo, la
mayoría de nosotros no puede prestar atención y recordar veinte comportamientos diferentes que ocurren en
Por lo tanto, algún límite en el rango de comportamientos debe determinar lo que planeamos observar.
Debemos elegir los comportamientos críticos para el problema que estudiamos. El segundo problema se
refiere a la reacción del participante al ser observado. Este problema, llamado reactividad, presenta
problemas al realizar cualquier tipo de investigación psicológica.
¿Qué observamos?
¿Cómo delimitamos el rango de conductas a estudiar? Parte de esta respuesta parece sencilla. Si
estamos interesados en la comunicación no verbal humana, observamos la comunicación no verbal
humana. Sin embargo, esto no es necesariamente fácil de hacer. En primer lugar, la comunicación
no verbal es muy compleja, lo que significa que los observadores nos enfrentamos al mismo
problema que intentamos evitar desde un principio: ¿Qué comportamientos no verbales observamos?
En segundo lugar, examinar las conductas no verbales presupone que ya conocemos algunas de
las conductas a observar. Evidentemente, no entramos en un proyecto de investigación desprovisto
de todo conocimiento, pero tampoco partimos de él con todas las respuestas. Por lo general,
comenzamos una serie de estudios de observación con algunos comportamientos en mente, y luego
los proyectos sucesivos se basan en datos previos para refinar y delimitar el campo de investigación.
Algunos ejemplos ilustrarán el procedimiento de refinamiento.
Un etograma La investigación naturalista de interés para los psicólogos parece más prevalente
en el área de la etología, el estudio del comportamiento natural (a menudo en la naturaleza).
La simple observación del comportamiento de animales o humanos permite una impresión global
de las características y el rango de comportamiento. Sin embargo, uno pronto puede desear una
observación más sistemática. Una forma en que los etólogos hacen observaciones más sistemáticas
es identificando diferentes categorías de experiencia para el organismo bajo estudio y luego
registrando la cantidad de veces que el organismo se involucra en cada comportamiento. Estos
comportamientos se pueden dividir en unidades grandes, como aparearse, arreglarse, dormir,
pelear, comer, etc., o en unidades mucho más pequeñas. Por ejemplo, en la Figura 2.2 se muestra
un etograma de los diversos comportamientos involucrados en el patrón de cortejo de un pez, el
cromuro naranja. (Un etograma es un inventario relativamente completo de los comportamientos
específicos realizados por una especie de animal). Al contar el número de veces que ocurre un
comportamiento específico, los etólogos pueden comenzar a tener una idea de la importancia del compo
Ficken y asociados (2000) caracterizaron los cantos de los colibríes garganta azul. También
desarrollaron un etograma de cuándo cantaban los colibríes. Claramente, los investigadores tenían
que poder grabar y analizar las canciones. Esta no es una empresa trivial.
Es difícil obtener registros precisos en un hábitat natural. Por ejemplo, la vigilancia continua
suele ser imposible, incluso con aparatos de registro automático. Además, tanto el aparato como
los observadores pueden dar lugar a reactividad, lo que estropearía las medidas. Estos son solo
algunos de los desafíos asociados con la observación naturalista de los animales.
Aplicar técnicas similares al comportamiento humano puede ser aún más difícil, porque la
gente no suele apreciar que un científico curioso anote cada una de sus acciones. Barker y sus
asociados (por ejemplo, Barker y Wright, 1951; Barker, 1968) fueron pioneros en la aplicación de la
observación naturalista a los humanos en varios escenarios, y el trabajo de Ginsburg y Miller (1982)
sobre la asunción de riesgos puede considerarse un ejemplo. ejemplo de etología humana. A
continuación se presentan ejemplos adicionales de observaciones naturalistas de humanos.
Reactividad
Hay dos métodos generales disponibles para tratar de evitar que las reacciones de los participantes
arruinen las observaciones: (1) observaciones no obstructivas y (2) medidas no obstructivas
(Webb et al., 1966). Consideramos estos a su vez.
Medidas discretas Las medidas discretas, en contraste con las observaciones discretas,
consisten en “observaciones” indirectas del comportamiento. Las medidas discretas son
indirectas porque lo que se estudia es el resultado del comportamiento, no el comportamiento
en sí. Por lo tanto, en lugar de observar el comportamiento directamente, lo examinamos
después del hecho observando lo que ha logrado el comportamiento. En lugar de observar las
actividades de estudio de un estudiante, examinamos su expediente académico. En lugar de
vivir con los gorilas, observamos su efecto sobre el medio ambiente. La diferencia crítica,
entonces, entre la observación discreta y las medidas discretas radica en si el sujeto y el
observador están en el mismo lugar al mismo tiempo. Cuando el investigador está presente,
él o ella intenta observar discretamente el comportamiento del sujeto. Cuando está ausente,
estudia el producto o resultado de la conducta.
Obviamente, las medidas discretas no son adecuadas para todas las preguntas que se
investigan (una medida discreta de un destello de cejas puede ser difícil), pero para algunos
problemas de investigación, estas medidas no son simplemente buenas, son las únicas que son
factibles. Considere la cuestión del graffiti en los baños públicos. ¿Quien lo hace? ¿Cuál es el
área temática habitual? Se plantearían una serie de preguntas éticas serias (la ética se analiza
en el Capítulo 4) si un investigador se quedara en los baños observando a los clientes.
El estudio de caso
Una de las formas más venerables de investigación en psicología es el estudio de casos. La
teoría psicoanalítica de Freud surgió de sus observaciones y reflexiones sobre casos individuales.
En general, un estudio de caso es la investigación intensiva de un solo caso de algún tipo, ya
sea un paciente neurótico, un médium espiritual o un grupo que espera el fin del mundo.
Festinger, Riecken y Schachter (1956) proporcionaron un interesante estudio de caso de este
último caso, quienes infiltraron a un pequeño grupo de personas que en realidad esperaban el
fin del mundo. Los miembros pensaron estar en contacto con seres de otro planeta, quienes le
habían comunicado a un miembro que la destrucción de la tierra estaba cerca. El grupo esperaba
ser rescatado por una nave espacial antes de la catástrofe. Festinger y sus compañeros estaban
especialmente interesados en las reacciones del grupo cuando no se producía la calamidad.
Observaron que para muchos de los miembros del grupo, la creencia en su sistema delirante en
realidad aumentó en lugar de disminuir después de que había pasado la fecha prevista de la
catástrofe.
El estudio de caso es un tipo de observación naturalista y está sujeto a las ventajas y
desventajas de ese método. Una desventaja principal es que los estudios de casos por lo general
no permiten hacer inferencias firmes sobre qué causa qué. Por lo general, todo lo que uno puede
hacer es describir el curso de los acontecimientos. A menudo, sin embargo, los estudios de
casos proporcionan comparaciones implícitas que permiten al investigador hacer algunas
conjeturas razonables sobre qué causa qué. El estudio de caso de KR, el contador compulsivo
que se describió anteriormente, reveló una educación excepcionalmente severa que involucró un
orden rígido y castigos severos por supuestos pecados y fechorías. La vida familiar actual de KR pa
Investigación de encuestas
Los estudios de casos generalmente involucran solo a unos pocos sujetos y, a menudo, estos
individuos no son en absoluto representativos de la población en general. PZ, por ejemplo, era a la
vez un científico brillante y un amnésico. A menudo, los investigadores desean obtener información
sobre una gran muestra aleatoria de personas en un área geográfica grande (como la encuesta
sobre ver televisión a altas horas de la noche al comienzo del capítulo), aunque la cantidad de
información obtenida de cualquier persona es necesariamente limitada. La investigación mediante
encuestas es mucho más común en algunas áreas de la psicología que en otras. Por ejemplo, esta
técnica se usa con bastante frecuencia en psicología industrial/organizacional, clínica y social, pero
casi nunca en psicología cognitiva. Una ventaja de la investigación por encuesta es que, dados los
procedimientos de muestreo precisos ahora disponibles, un investigador puede encuestar a un
número relativamente pequeño de personas para generalizar bien a la población en general.
Debido a que la encuesta conduce a resultados que generalmente son de naturaleza
descriptiva, esta técnica no es particularmente popular entre los psicólogos en áreas con una fuerte
Finalmente, recuerde que el trabajo de encuesta realizado por Moy y sus asociados (2005) luego de la
aparición de George W. Bush en el Late Show con David Letterman encontró que los espectadores de
Letterman tenían calificaciones más altas de cuánto se preocupa Bush por "gente como yo" que hicieron los
no espectadores. Esta técnica de comparación es muy similar al trabajo de estudio de caso sobre la memoria
de PZ, y esta técnica de encuesta también proporciona una comparación similar a un experimento. Sin
embargo, no se asignó a las personas a ser espectadores o no espectadores, lo que significa que, como en el
caso de PZ, la comparación no es tan sólida como la utilizada en la experimentación (ver más abajo).
Por supuesto, los estudios de casos de Freud se basan enteramente en tales interpretaciones
de los hechos. Además de ser irreproducibles, los críticos acusan a tales casos de la posibilidad de
que si se nos permite (1) seleccionar nuestros datos de los estudios de casos y las respuestas que la
gente da a las preguntas que hacemos y luego (2) entretejer estos "hechos" en un sistema conceptual
de nuestra propia creación, los estudios de casos probablemente podrían usarse para “probar”
cualquier teoría. (Esto no es para desmerecer el talento creativo y el genio evidentes en el sistema de
Freud; sin embargo, ciertamente está abierto a la crítica en términos de la evidencia que usó como
base de su teoría).
Pavlov reporta otro ejemplo de este problema interpretativo que está más cerca de la psicología
científica en su investigación temprana sobre el reflejo condicionado (ver Capítulo 9). Cuando
comenzaron a estudiar los procesos psicológicos del perro, él y sus compañeros de trabajo descubrieron
que tenían un problema que no había sido aparente cuando anteriormente se preocupaban únicamente
por el sistema digestivo. El problema era grave, porque no podían ponerse de acuerdo sobre las
observaciones que estaban haciendo. Pavlov describe el problema de estudiar los reflejos condicionados:
Pero, ¿cómo se estudia esto? Tomando al perro cuando come deprisa, le arrebata
algo en la boca, mastica durante mucho tiempo, parece claro que en ese momento el
medios para agarrar la comida en la boca, masticarla y tragarla. De todo esto podemos decir que obtiene
placer de ello. . . . Ahora, cuando procedimos a explicar y analizar
esto, rápidamente adoptamos este trillado punto de vista. Tuvimos que lidiar con los sentimientos, deseos,
concepciones, etc., de nuestro animal. Los resultados fueron asombrosos, extraordinarios; Uno de mis colegas
y yo llegamos a opiniones irreconciliables. No podíamos ponernos de acuerdo, no podíamos demostrarnos
uno al otro cuál tenía razón. . . . Después de esto tuvimos
que deliberar cuidadosamente. Parecía probable que no estuviéramos en el camino correcto. Cuanto más
pensábamos en el asunto, más crecía nuestra convicción de que era necesario elegir otra salida. Los primeros
pasos fueron muy difíciles, pero en el camino del pensamiento persistente, intenso y concentrado, finalmente
llegué al suelo firme de la pura objetividad. Nos prohibimos absolutamente (en el laboratorio se impuso una
multa real) el uso de expresiones psicológicas tales como el perro adivinó, quiso, deseó, etc.
Aquí se discute otro problema, aunque es relevante para todos los tipos de observación en
todos los tipos de investigación. Esta es la cuestión de hasta qué punto nuestros esquemas
conceptuales determinan y sesgan lo que “vemos” como hechos. La afirmación de Pavlov es un
testimonio elocuente de lo difícil que es establecer métodos objetivos para que todos podamos ver
los hechos de la misma manera. Inicialmente, le pareció "asombroso" y "extraordinario" que esto
fuera así y se sorprendió de las elaboradas precauciones necesarias para garantizar la objetividad.
Los filósofos de la ciencia han señalado que nuestras observaciones siempre están influenciadas
por nuestras concepciones del mundo, si no de otra manera, al menos por las observaciones
particulares que hacemos (ver, por ejemplo, Hanson, 1958, Capítulo 2). La “objetividad pura”, para
usar la frase de Pavlov, es bastante elusiva, si no imposible. Una ilustración que usa Hanson es la
de dos microbiólogos capacitados que observan un portaobjetos teñido y preparado a través de un
microscopio y “ven” cosas diferentes.
(Como es bien sabido, lo principal que un novato informa que ve en un microscopio es su propio
globo ocular). La observación objetiva y repetible en ciencia es un ideal aproximado, pero es posible
que nunca estemos completamente seguros de haberlo logrado. lo logro Ciertamente, sin embargo,
debemos dar todos los pasos posibles hacia este ideal, que es de lo que se ocupa gran parte de la
parafernalia técnica de la ciencia.
Sin embargo, el problema de las observaciones indebidamente influidas por las expectativas
no se resuelve automáticamente mediante el uso del equipo técnico de la ciencia pura, como es
evidente en una ilustración citada por Hyman (1964, p. 38). En 1902, poco después de que se
descubrieran los rayos X, el eminente físico francés RP Blondlot informó del descubrimiento de los
“rayos N”. Otros científicos franceses rápidamente repitieron y confirmaron el descubrimiento de
Blondlot; en 1904 aparecieron no menos de setenta y siete publicaciones sobre el tema. Sin
embargo, el descubrimiento se volvió polémico cuando los científicos estadounidenses, alemanes e
italianos no lograron replicar los hallazgos de Blondlot.
El físico estadounidense RW Wood, al no encontrar rayos N en su propio laboratorio en la
Universidad Johns Hopkins, visitó Blondlot. Blondlot mostró una tarjeta a Wood con círculos
luminosos pintados en ella. Luego apagó la luz de la habitación, fijó los rayos N en la tarjeta y le
indicó a Wood que los círculos aumentaban en luminosidad. Cuando Wood dijo que no podía ver
ningún cambio, Blondlot argumentó que esto debía deberse a que los ojos de Wood eran demasiado
insensibles. A continuación, Wood preguntó si podía realizar algunas pruebas sencillas, a lo que Blond
ÿ EL ENFOQUE RELACIONAL
Los científicos describen, relacionan y experimentan. La investigación relacional intenta determinar cómo
dos (normalmente) o más variables se relacionan entre sí. Una variable es algo que se puede medir o
manipular. Por lo general, la investigación relacional no implica la manipulación de variables, por lo que los
datos relacionados se denominan datos ex post facto , que significa "después del hecho". Los datos que se
relacionan provienen de eventos que ocurren naturalmente y no resultan de la manipulación directa por parte
del investigador. El investigador categoriza o evalúa los datos y sondea las relaciones.
Investigación de contingencias
Los porcentajes en la tabla indican claramente que existe una relación entre el género de una persona
y su elección de especialización en esta universidad en particular: La historia ha
programa principal
36 50 22 57 49
programa principal
29 18 66 23 17
programa principal
Mujeres 36 50 22 57 49 214
proporcionalmente más hombres que mujeres en carreras, y lo contrario es cierto para los otros
programas principales. Este tipo de relación indica una falta de independencia entre el género y la
elección de carrera. Si quisiera analizar estadísticamente los datos de la tabla, probablemente usaría
2
una prueba de independencia, que sieslos
una
datos
prueba
de una
estadística
tabla deque
contingencia
se usa a menudo
son estadísticamente
para determinar
significativos.
El cálculo de esta estadística se ilustra en el Apéndice B.
La reactividad de los participantes puede ser un problema en la investigación de contingencias,
especialmente cuando los participantes han sido entrevistados o encuestados. Sin embargo, no todas
las investigaciones de contingencia están sujetas a reactividad. Los datos presentados en la Tabla 2.1
son completamente ex post facto, por lo que las personas que declararon una carrera en particular no
saben que han aparecido en una celda en particular de una tabla de contingencia. Al principio, esto
puede parecer un factor importante a favor de dicha investigación. Sin embargo, debe tener en cuenta
que se desconoce la reactividad de los participantes en este ejemplo en particular. El verdadero
problema es que podrían haber elegido una especialización en particular por razones reactivas ("Mamá
quiere que yo sea un estudiante de inglés"). No existe una forma sencilla de determinar ese tipo de reactiv
Investigación correlacional
El coeficiente de correlación
Un coeficiente de correlación mide el grado y la dirección de la relación entre dos variables. Hay varios
tipos diferentes de coeficientes de correlación, pero casi todos tienen en común la propiedad de que pueden
variar de 1,00 a 0,00 y hasta 1,00. Por lo general, no serán una de estas tres cifras, sino algo intermedio,
como .72 o .39. La magnitud del coeficiente de correlación indica el grado de relación (los números más
grandes reflejan mayores relaciones), y el signo indica la dirección de la relación, positiva o negativa. Es
importante poner el signo apropiado delante del coeficiente de correlación, de lo contrario no se puede saber
de qué manera se relacionan las dos variables, positiva o negativamente. Sin embargo, es una práctica
común omitir el signo más antes de las correlaciones positivas para que una correlación de .55 se interprete
como .55. Es una mejor práctica incluir siempre el signo. Un ejemplo de una correlación positiva es la
relación entre el cáncer de pulmón y el tabaquismo. A medida que aumenta una variable, también lo hace la
otra (aunque no perfectamente, es decir, el coeficiente de correlación es inferior a 1,00). También existe una
correlación negativa documentada entre fumar y otra variable, a saber, las calificaciones en la universidad.
Las personas que fuman mucho tienden a tener calificaciones más bajas que las que fuman menos (Huff,
1954, p. 87).
Como se mencionó, existen varios tipos diferentes de coeficientes de correlación, y el tipo que se utiliza
depende de las características de las variables que se correlacionan. Consideramos uno comúnmente
utilizado por los psicólogos: la correlación producto-momento de Pearson.
Esta “teoría” propone una relación simple: que a medida que aumenta el tamaño de la cabeza,
también debería hacerlo la memoria. Se prevé una correlación positiva entre estas dos variables. Se
podría tomar una muestra aleatoria de la población local. Las personas elegidas podrían medirse en
dos dimensiones: el tamaño de la cabeza y la cantidad de palabras que pueden recordar de una lista
de treinta, que se les presenta una vez, a razón de una palabra cada tres segundos. En la Tabla 2.2
se presentan tres conjuntos hipotéticos de resultados de diez sujetos. Para cada individuo hay dos
medidas, una del tamaño de la cabeza y la otra del número de palabras recordadas. Además, los dos
tipos de medidas no necesitan ser similares de ninguna manera para estar correlacionados. No tienen
que estar en la misma escala. Así como se puede correlacionar el tamaño de la cabeza con el número
de palabras recordadas, también se puede correlacionar el coeficiente intelectual con el número de la
dirección o cualquier par de números.
Las representaciones gráficas de los datos en los tres paneles de la Tabla 2.2 se presentan en
los tres paneles de la Figura 2.3; el tamaño de la cabeza se traza a lo largo del eje X horizontal (las
abscisas) y el número de palabras recordadas se traza a lo largo del eje Y vertical (las abscisas).
ÿ TABLA 2.2
Tres ejemplos hipotéticos de datos tomados sobre el tamaño de la cabeza y el recuerdo. Los
ejemplos representan (a) una correlación positiva, (b) una correlación baja (casi cero) y (c) una
correlación negativa.
Tema Tamaño (cm) (palabras) Tema Tamaño (cm) (palabras) Tema Tamaño (cm) (palabras)
20
15
(palabras)
recordar
10
30 40 50 60 30 40 50 60 30 40 50 60
Representación gráfica de los datos de la tabla 2.2. Estos gráficos muestran el patrón
característico de (a) una correlación positiva alta, (b) una correlación esencialmente cero y (c)
una correlación negativa fuerte.
ordenada). La alta correlación positiva entre el tamaño de la cabeza y el número de palabras recordadas
en el panel (a) de la Tabla 2.2 se traduce en una representación visual que se inclina hacia arriba a la
derecha, mientras que la correlación negativa en (c) se representa con una pendiente hacia abajo. Correcto.
Así, puedes ver cómo conocer la puntuación de una persona en una variable ayuda a predecir (aunque no
perfectamente en estos casos) el nivel de desempeño en la otra. Entonces, conocer el tamaño de la cabeza
de una persona en los datos hipotéticos en (a) y (c) ayuda a predecir el recuerdo y viceversa. Esta es la
razón principal por la que las correlaciones son útiles: especifican la cantidad de relación y permiten hacer
predicciones. Esta última afirmación no se puede hacer sobre los datos en (b), donde hay esencialmente
una relación de correlación cero. Los puntos están dispersos y no hay una relación consistente, que es
justo lo que refleja una r de Pearson baja. Incluso en los casos en que el tamaño de la correlación sea
bastante grande, no será posible predecir perfectamente la puntuación de un individuo en una variable
dada su posición en la otra. Incluso con una alta correlación (0,93) entre el tamaño de la cabeza y el
número de palabras recordadas, es muy posible que una persona con un tamaño de cabeza grande
recuerde pocas palabras y viceversa. A menos que la correlación sea perfecta (1,00 o 1,00), la predicción
de una puntuación cuando se da la otra tampoco será perfecta.
¿Cuál crees que sería la correlación real entre el tamaño de la cabeza y el recuerdo para una muestra
aleatoria de la población en general? Aunque en realidad no hemos realizado un estudio de este tipo,
creemos que es bastante probable que sea positivo. Willerman y asociados (1991) realizaron una
investigación sobre un tema relacionado, la relación entre el tamaño del cerebro y la inteligencia, o CI.
Encontraron una correlación de 0,51 entre el tamaño del cerebro y el coeficiente intelectual en una muestra
de cuarenta estudiantes caucásicos diestros de introducción a la psicología. Los resultados de estudios
recientes sobre el volumen cerebral realizados por Haier y colaboradores (Haier, Jung, Yeo, Head & Alkire,
2004; Colom, Jung y Haier, 2006) demuestran que un mayor volumen de áreas cerebrales se correlaciona
positivamente con el coeficiente intelectual, y estas áreas se distribuyen por todo el cerebro. ¿Significan
los datos del tamaño del cerebro que el tamaño del cerebro provoca diferencias en la capacidad cognitiva?
En la siguiente sección, abordamos el tema de la correlación y la causalidad.
ÿ FIGURA 2.4
18
Una figura hipotética que
dieciséis
representa una relación curvilínea
14 entre la memoria a largo plazo y la
edad. Aunque la memoria se
12 relaciona con la edad de forma
sistemática y se podría predecir el
10 recuerdo conociendo la edad, la r de
Pearson sería bastante baja, ya que la r
(recuerdo
palabras)
Memoria
de
10 20 30 40 50 60 70 80
Años de edad)
“La violencia mediática representa una amenaza para la salud pública en la medida en que conduce a
un aumento de la violencia y la agresión en el mundo real” (Huesmann & Taylor, 2006, p. 393). ¿Cómo
determinamos si ver medios violentos provoca un comportamiento agresivo? Eron y asociados (1972)
midieron las preferencias de los niños por los programas de televisión violentos y la agresividad de los
niños según la calificación de sus compañeros. Para estos alumnos de tercer grado, Eron y sus
compañeros de trabajo encontraron una correlación
niños que
positiva
eranmoderada,
más agresivos
r .21,tendían
lo que indica
a ver televisión
que los
más violenta (y los niños menos agresivos tendían a ver programas menos violentos). ¿Cómo debemos
interpretar esta correlación positiva? ¿Podemos decir que ver programas violentos provoca agresividad?
La respuesta es no. Para ver por qué este es el caso, todo lo que tenemos que hacer es dar la vuelta
a nuestra declaración causal y afirmar que ser agresivo provoca una preferencia por la televisión
violenta. No tenemos una forma razonable de decidir sobre la dirección de la causalidad, basándonos
en este único coeficiente de correlación. Las declaraciones causales son difíciles, si no imposibles, de
hacer sobre la base de un solo estudio correlacional. En cambio, los investigadores suelen ver la
evidencia correlacional como tentativa hasta que haya evidencia convergente de estudios independientes
y se identifique un mecanismo subyacente convincente.
El poder explicativo de la investigación correlacional puede mejorarse examinando patrones de
correlaciones. Una técnica es el llamado procedimiento de correlación de panel cruzado , y Eron y
sus colaboradores la usaron en un estudio de seguimiento de diez años de los mismos niños en el
"treceavo" grado, así como en un proyecto reciente que examinó la agresión en niños. adultos que
fueron entrevistados inicialmente a mediados de la década de 1970 (Huesmann et al., 2003).
Los diseños de los dos estudios se resumen en los dos paneles de la Figura 2.5.
La lógica del procedimiento cruzado es que las correlaciones a lo largo de las diagonales nos
ayudarán a comprender la dirección de causalidad entre las variables. ¿Las personas agresivas ven
televisión violenta o ver televisión violenta produce agresión? Si ver televisión violenta produce un
comportamiento agresivo, esperaríamos una relación pequeña o nula entre la agresión temprana y la
preferencia posterior por la televisión violenta (las diagonales punteadas) y una correlación positiva
entre una preferencia temprana por la televisión violenta y la agresión posterior (las líneas gruesas y
sólidas). diagonal). La suposición subyacente es que si una variable causa la otra, la primera (ver
programas de televisión violentos) debería estar más fuertemente relacionada con la segunda
(agresividad) más adelante en el tiempo que cuando la segunda variable (efecto) se mide al mismo
tiempo. como primera causa. Las correlaciones restantes son de interés y pueden permitir predicciones,
pero adolecen de la incapacidad para determinar la causalidad. En el proyecto de 1972 se estudiaron
211 machos. Tanto hombres (152) como mujeres (176) proporcionaron datos para el informe de 2003.
Para el estudio de 1972, la correlación entre la preferencia por la televisión violenta y la agresión fue
esencialmente cero (r -0,05) en el decimotercer grado. Asimismo, encontraron una relación insignificante
entre la preferencia por la TV violenta en tercero y decimotercer grado (r .05). Sí obtuvieron una relación
entre la agresividad en los dos grados.
r = +.21
agresión en agresión en el
el tercer grado decimotercer grado
(a)
agresión en agresión en
Infancia Edad adulta
(b)
ÿ FIGURA 2.5
(a) El diseño de correlación de panel cruzado utilizado por Eron et al. (1972), quienes examinaron las
correlaciones entre la preferencia por los programas de televisión violentos y la agresión calificada por
los compañeros. Las diagonales indican correlaciones cruzadas importantes. La correlación discontinua
debe ser pequeña, se espera que la sólida sea positiva y grande. (b) El diseño utilizado por Huesmann
et al. (2003). La preferencia por los programas de televisión violentos se correlacionó con la agresión.
Los participantes fueron examinados por primera vez entre los seis y los diez años y luego unos quince
años más tarde. La agresión de adultos se midió por incidentes autoinformados, calificaciones de otra
persona (incluidos los cónyuges) y registros de arrestos. La medida de la agresión es una medida
compuesta que incluye tanto la violencia física como la agresión verbal.
Le hemos advertido repetidamente sobre la conclusión incorrecta de que una correlación significa
causalidad. La causalidad es un tema controvertido en la ciencia y la filosofía, y ahora consideraremos
algunos de los temas. Debido a la influencia de algunos filósofos de la ciencia, se ha vuelto impopular
entre los científicos contemporáneos usar el término causa, porque las implicaciones filosóficas se
vuelven terriblemente complicadas. Pensar demasiado en la causa de incluso un evento muy simple
conduce a una regresión infinita de las causas de ese evento.
Por esta y otras razones, el término causa ha dejado de usarse en algunos círculos. En este libro
nos equivocamos en el uso del término causa, ya que su significado es siempre limitado; los
experimentos conducen a inferencias causales porque un factor varía mientras que todos los demás,
en el caso ideal, se mantienen constantes. Por lo tanto, podemos decir que cualquier efecto que
ocurra en tales casos ha sido causado por el factor que varió.
Dado que el verdadero factor causal (participación personal) puede estar incrustado dentro de la
variable manipulada (tiempo de estudio), debemos considerar esa posibilidad cuidadosamente al
realizar experimentos. No obstante, la ventaja de los experimentos sobre los estudios correlacionales
reside en que conocemos la dirección de la relación entre dos variables. Los experimentos también
nos informan (lo que no hace una correlación) de que el factor causal está al menos incrustado en la
variable independiente y no en algún tercer factor extraño. Es en este sentido que los experimentos
nos hablan de las causas.
Antes de pasar al próximo capítulo, concluyamos esta discusión señalando que no existe una
sola técnica de investigación que sea generalmente superior a todas las demás. La clave para realizar
una buena investigación es elegir la técnica que mejor se adapte a la hipótesis que se está probando.
Si la hipótesis se centra en el comportamiento tal como ocurre de forma natural (ya sea la actividad
de acicalamiento de los primates en la jungla o el grafiti escrito por los humanos en los baños
públicos), entonces la observación naturalista sería más apropiada.
ÿ RESUMEN
1. Gran parte de la ciencia se preocupa por la observación cuidadosa. correlacionada con la distancia de ubicación desde el ecuador.
vación y estudio del mundo natural. Dos técnicas básicas Existen varias medidas de correlación, pero la más utilizada por
discutidas en este capítulo son la observación naturalista y el los psicólogos es el coeficiente de correlación producto-momento
enfoque correlacional. Ambos son métodos científi cos útiles, de Pearson:
pero no permiten declaraciones sobre qué factores causan qué. ciente, o Pearson r.
6. El enfoque correlacional permite establecer la cantidad de relación
efectos Son muy útiles en las primeras etapas de exploración de entre dos variables, lo cual es útil para la predicción. Sin embargo,
un tema y en el estudio de temas que no pueden ser estudiados su principal inconveniente es que no puede establecer la dirección
de manera práctica o ética por medios experimentales.
de relación Incluso si dos variables, X e Y, están fuertemente
2. Después de delimitar el rango de eventos que se van a estudiar, relacionadas, no podemos decir si la relación es accidental, X
la observación naturalista normalmente implica la observación causó Y, Y causó X, o algún tercer factor causó ambos.
discreta (no reactiva) o la medición discreta de los eventos que
ocurren naturalmente en el medio ambiente. De mayor utilidad 7. En los estudios correlacionales, una serie de factores suelen variar
para los psicólogos son dos variantes reactivas de la observación juntos, por lo que los resultados se confunden.
naturalista: caso Pero la investigación correlacional es bastante apropiada en
estudios y encuestas. Sin embargo, estos métodos de observación situaciones en las que es imposible realizar experimentos, por
tienen la desventaja de no permitir afirmaciones sobre cómo se ejemplo, en el estudio de condiciones relacionadas con disturbios
relacionan los factores entre sí. raciales.
otro. 8. Cuando los investigadores descubren que la correlación
3. La investigación relacional intenta mostrar cómo se relacionan las entre dos medidas es cercano a cero, a menudo concluirán que
variables entre sí. La investigación relacional es no hay relación entre la
normalmente ex post facto en el sentido de que las variables no medidas. Antes de llegar a tal conclusión, aunque a menudo sea
se manipulan, sino que se miden. correcta, los investigadores deben determinar si se han cumplido
4. La investigación de contingencia trata de determinar si el valor de los supuestos que subyacen al uso de la medida correlacional.
una variable depende del valor de otra. Una pregunta típica podría uno común
ser tratar de determinar si la elección de un programa principal el problema es la restricción del rango, o la falta de variación en
está relacionada con el género de una persona. Una prueba la distribución de un conjunto de puntajes. si todo el
estadística utilizada para determinar si dos variables son medidas de una variable son casi iguales, el coeficiente de
independientes es la prueba de independencia. correlación se aproximará a cero, incluso si existe una verdadera
relación entre las medidas cuando
5. El enfoque correlacional permite enunciados de relación, de qué se toma una muestra más amplia de puntajes.
va con qué. Las correlaciones pueden variar de 1,00 a 1,00, 9. Muchas investigaciones intentan introducir una medida de control
donde la magnitud del número reflejasigno
la fuerza
indica
delaladirección.
relación y el en los estudios correlacionales para determinar mejor
relaciones de causa y efecto. En algunos casos, las técnicas
estadísticas, como el procedimiento correlacional cruzado, se
Por ejemplo, la altura se correlaciona positivamente con el peso pueden utilizar para tratar de determinar las causas en los
y la temperatura media anual se correlaciona negativamente. estudios correlacionales.
ÿ PREGUNTAS DE DISCUSIÓN
1. Imagina que eres un investigador que acaba de comenzar un se vería si uno estuviera allí. Dado que muy pocas mujeres
estudio sobre cómo las madres interactúan con sus bebés. fumaban en 1930, también parecía mejor relacionar las tasas
Quiere hacerse una idea de la frecuencia (1) de la realización de tabaquismo con las muertes de hombres. La tabla es una
por parte de la madre de algún acto con respecto al bebé que adaptación de los importantes resultados de Doll.
es relativamente independiente de las necesidades inmediatas (a) Examine los resultados. ¿Qué significan las dos columnas?
del bebé, (2) de las diversas formas en que el bebé actúa de números parecen mostrar?
cuando la madre no está presente. atendiendo a él, y (3) de las (b) Trace una gráfica que relacione las dos medidas, como la
acciones de la madre y el niño cuando están interactuando. Haz que se muestra en la figura 2.3. ¿Que muestra?
una lista de todos los comportamientos que crees que pueden
ocurrir con una frecuencia relativamente grande en las tres
categorías. Este sería un tipo de etograma, como se discutió en
este capítulo. Si observara a las madres y los bebés durante Resultados de la muñeca
1930 y el número de muertes por cáncer de pulmón entre los Noruega 250 90
hombres en 1950. La medida de las muertes se tomó veinte Suecia 300 110
Suiza 510 250
años después de la medida del consumo de cigarrillos, ya que
Unido 1,300 200
parece natural que tomaría años para una relación de causa y estados
efecto a
*De cáncer de pulmón.
CONEXIONES WEB
Explore la presentación paso a paso de "Enfoques no experimentales para la investigación: el método de la
encuesta" en el Centro de recursos de psicología de Wadsworth,
Actividades de Estadística y Métodos de Investigación en:
http://academic.cengage.com/psychology/workshops
ÿ RECURSO DE LABORATORIO
Los capítulos 1 y 2 del manual de Langston analizan la observación naturalista y la investigación por sondeo,
respectivamente. La investigación de observación naturalista se refiere a los seres humanos que defienden los
espacios de estacionamiento, y la investigación de encuestas se enfoca en la inflación de calificaciones en la universidad.
El manual de Langston (2002) analiza la investigación relacional en el Capítulo 3. Los principales
La cuestión examinada por Langston es la relación entre la tenencia de mascotas y la salud.
Langston, W. (2002). manual de laboratorio de metodos de investigacion para psicologia. Pacífico
Grove, CA: Grupo Wadsworth.
CAPÍTULO 3
INVESTIGAR
TÉCNICAS:
EXPERIMENTOS
¿QUÉ ES UN EXPERIMENTO?
Cuasi-Experimentos
Obtención de datos
Análisis de datos
Informe de datos
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB 51
Imagina que eres un estudiante en una clase de psicología ambiental y has recibido la
siguiente tarea: ve a la biblioteca y “defiende” una mesa evitando que alguien más se siente
tanto tiempo como puedas. Debe usar solo medios no verbales y no violentos para lograr esto.
Para llevar a cabo esta tarea, puede esperar en la biblioteca abarrotada hasta que una mesa
esté vacía, sentarse rápidamente y proceder a esparcir sus libros, ropa y otras pertenencias por
toda la mesa con la esperanza de que este desorden pueda mantener alejados a los demás.
Después de algún tiempo, digamos, quince minutos más o menos, alguien finalmente se sienta
en su mesa y termina su tarea. ¿Has realizado un experimento?
Antes de responder a esta pregunta, esbocemos los principales criterios para un
experimento, que se discutieron brevemente en los capítulos anteriores. Un experimento ocurre
cuando el entorno se manipula sistemáticamente para que se pueda observar el efecto causal
de esta manipulación en algún comportamiento. Los aspectos del entorno que no son de interés
y, por lo tanto, no se manipulan, se mantienen constantes para no influir en el resultado del
experimento. Entonces podemos concluir que el comportamiento resultó de la manipulación.
Debemos explicar dos términos especiales que se introdujeron brevemente en el capítulo 1
(variables independientes y dependientes ) para describir cómo se manipula el entorno y cómo
se observa el comportamiento.
ÿ ¿QUÉ ES UN EXPERIMENTO?
Muchos estudiantes se sorprenden al descubrir que las acciones descritas en nuestro ejercicio
de la mesa de la biblioteca no constituyen un experimento. Todos los experimentos requieren al
menos estas dos características especiales, las variables independientes y dependientes que
acabamos de mencionar. La variable dependiente es la medida de respuesta de un experimento
que depende del sujeto. En este caso, el tiempo que transcurre hasta que alguien más se sienta
a la mesa es la variable dependiente o medida de respuesta. La variable independiente es
una manipulación del entorno controlada por el experimentador: en este caso, es el esparcimiento
de artículos sobre la mesa.
Pero un experimento debe tener al menos dos valores, o niveles, del entorno.
Estos niveles pueden diferir en un sentido cuantitativo (artículos esparcidos por solo una parte
de la mesa versus artículos esparcidos por toda la mesa), o los niveles pueden reflejar una
diferencia cualitativa (la persona que defiende la mesa asume una expresión amistosa e invitante
como opuesta a una expresión severa y amenazante). El punto es que al menos dos condiciones
deben compararse entre sí para determinar si la variable independiente (porción de la mesa
cubierta o expresión facial) produce un cambio en un comportamiento o resultado.
A veces, estos dos niveles pueden ser simplemente la presencia o ausencia de una
manipulación. El ejemplo de la biblioteca no cumple con este criterio, ya que involucra solo un
nivel de la variable independiente.
¿Cómo podríamos cambiar el procedimiento para obtener un experimento? La forma más
sencilla sería volver a sentarse, esta vez sin desparramar nada. Entonces nuestro independiente
Este experimento tiene tres resultados posibles: (1) Tirar artículos sobre la mesa da como
resultado un tiempo más largo antes de que otra persona invada la mesa; (2) el tiempo hasta la
invasión es el mismo, estén o no esparcidos los artículos; y (3) la dispersión de artículos da como
resultado un tiempo más corto hasta la invasión. Sin el segundo nivel de la variable independiente (la
tabla sin artículos esparcidos), estos tres resultados no pueden formularse. De hecho, es imposible
decir nada acerca de cuán efectivos son los artículos esparcidos para defender las tablas de la
biblioteca hasta que se prueban dos niveles de la variable independiente.
Cuando este experimento de biblioteca se realiza correctamente, se obtiene el primer resultado
posible. Una mesa puede estar mejor protegida por una persona más artículos variados que por una
persona sola.
Podemos ver, entonces, que los experimentos deben tener al menos variables independientes
y dependientes. Las técnicas de investigación discutidas en el capítulo anterior no permiten ni
requieren la manipulación del entorno; pero antes de que se pueda establecer un experimento , se
necesitan variables independientes con al menos dos niveles.
Las mismas razones generales que se aplican a la realización de cualquier investigación también
explican por qué los psicólogos realizan experimentos. En la investigación básica, los experimentos se
realizan para probar teorías y proporcionar una base de datos para explicaciones del comportamiento.
Este tipo de experimentos suelen estar bien planificados y el investigador tiene una idea clara del
resultado previsto. Los llamados experimentos críticos intentan enfrentar dos teorías que hacen
predicciones diferentes. Un resultado favorece la teoría A; la otra, la teoría B. Así, en principio, el
experimento determinará qué teoría rechazar y cuál mantener. En la práctica, estos experimentos
críticos no funcionan tan bien, porque los partidarios de la teoría rechazada son ingeniosos al idear
explicaciones para desacreditar la interpretación desfavorable del experimento. Un ejemplo de tal
explicación se encuentra en un estudio sobre cómo olvida la gente. Dos explicaciones principales del
olvido son que (1) los elementos se desvanecen o se desvanecen con el tiempo, de la misma manera
que una bombilla incandescente se desvanece cuando se apaga la electricidad (esta explicación se
llama "decaimiento de rastros") o que (2) los elementos nunca se desvanecen , pero debido a esto,
interfieren entre sí, causando confusión. Un experimento crítico simple variaría el tiempo entre la
introducción en la memoria de elementos sucesivos, manteniendo constante el número de elementos
(Waugh & Norman, 1965). La memoria debería ser peor con tiempos más largos, según los teóricos del
decaimiento de trazas, porque hay más tiempo para que los elementos se desvanezcan. Pero debido a
que la cantidad de elementos sigue siendo la misma independientemente del momento en que se
introduzcan, la teoría de la interferencia no predice diferencias en el olvido. Cuando se realiza este
experimento, no hay diferencia en la memoria; esto parecería anular la explicación de la descomposición
de las huellas. Sin embargo, la réplica de los teóricos del deterioro de las huellas es que el tiempo
adicional que se otorga entre los elementos permite a las personas ensayar, es decir, repetir el elemento
para sí mismos, lo que evita el olvido.
Con menos frecuencia, los investigadores realizan un experimento en ausencia de una teoría
convincente solo para ver qué sucede; podemos llamar a esto un experimento hipotético. Los
estudiantes suelen idear experimentos hipotéticos, ya que estos experimentos no requieren
conocimientos teóricos ni de la base de datos existente y pueden formularse sobre la base de la
experiencia personal y las observaciones. Algunos científicos desaprueban los experimentos hipotéticos;
la principal objeción a ellos es su ineficiencia. Si, como suele ser el caso, no ocurre gran cosa en un
experimento hipotético (por ejemplo, la variable independiente no tiene ningún efecto), no se gana nada
con el experimento. Por el contrario, si no sucede gran cosa en un experimento cuidadoso para el cual
una teoría predice que algo sucederá, el hallazgo de que no hay diferencia puede ser útil. Debemos
admitir que hemos intentado experimentos hipotéticos. La mayoría de ellos no funcionaron, pero fueron
divertidos. Nuestro consejo es que consulte con su instructor antes de intentar una prueba hipotética.
Esto nos lleva a la última razón importante para hacer experimentos en investigación básica, que es repetir o
replicar un hallazgo anterior. Un solo experimento por sí mismo es mucho menos convincente que una serie de
experimentos relacionados. La replicación más simple es la repetición directa de un experimento existente, sin
cambios en los procedimientos. Las réplicas directas son especialmente útiles cuando el experimento original era
bastante novedoso. Por lo general, sin embargo, una mejor manera de replicar es extender el procedimiento anterior
agregando algo nuevo y conservando algo antiguo. Así, parte de la replicación es una repetición literal, pero la parte
novedosa se suma al conocimiento científi co. Este tipo de repetición demuestra la generalidad de un resultado al
mostrar cómo se mantiene (o no) sobre diferentes variables independientes. El concepto de replicación y sus diversas
formas se analizan con más detalle en el Capítulo 11.
ÿ VARIABLES
Las variables son los engranajes y ruedas dentadas que hacen funcionar los experimentos. La selección y
manipulación eficaz de las variables marcan la diferencia entre un buen experimento y uno deficiente.
Esta sección cubre los tres tipos de variables que deben considerarse cuidadosamente antes de comenzar un
experimento: variables independientes, dependientes y de control. Concluimos discutiendo experimentos que tienen
más de una variable independiente o dependiente.
Variables independientes
En los experimentos verdaderos, las variables independientes son aquellas manipuladas por el experimentador.
El brillo de una luz, el volumen de un tono, la temperatura de una habitación, el número de gránulos de comida que
se dan a una rata, todas son variables independientes, ya que el experimentador determina su calidad y cantidad. Las
variables independientes se seleccionan porque un experimentador cree que provocarán cambios en el
comportamiento. Aumentar la intensidad de un tono debería aumentar la velocidad con la que las personas responden
al tono. Aumentar la cantidad de gránulos que se le da a una rata por presionar una barra debería aumentar la
cantidad de veces que se presiona la barra. Cuando un cambio en el nivel (cantidad) de una variable independiente
provoca un cambio en el comportamiento, decimos que el comportamiento está bajo el control de la variable
independiente.
El fracaso de una variable independiente para controlar el comportamiento, a menudo llamado resultados nulos,
puede tener más de una interpretación. Primero, el experimentador puede haber adivinado correctamente que la
variable independiente era importante: los resultados nulos pueden ser correctos.
La mayoría de los científicos aceptarán esta interpretación de mala gana, por lo que las siguientes explicaciones
alternativas de resultados nulos son comunes. Es posible que el experimentador no haya creado una manipulación
válida de la variable independiente. Supongamos que está realizando un experimento con niños de segundo grado y
su variable independiente es la cantidad de dulces pequeños (M&M, gominolas) que obtienen después de cada
respuesta correcta.
Algunos niños reciben solo uno, mientras que otros obtienen dos. No encuentras ninguna diferencia en el
comportamiento. Sin embargo, si su variable independiente hubiera involucrado un rango mayor, es decir, de una
golosina a diez golosinas, tal vez hubiera obtenido un
Variables dependientes
Variables de control
Una variable de control es una variable independiente potencial que se mantiene constante durante un
experimento porque está controlada por el experimentador. Para cualquier experimento, la lista de variables
de control relevantes es bastante grande, mucho más grande de lo que se puede lograr en la práctica. Incluso
en un experimento relativamente simple, por ejemplo, que requiera que las personas memoricen sílabas de
tres letras, se deben controlar muchas variables. La hora del día cambia su eficiencia; idealmente, esto
debería ser controlado. La temperatura podría ser importante, porque podría quedarse dormido si la sala de
pruebas estuviera demasiado caliente. El tiempo transcurrido desde la última comida también podría afectar
el rendimiento de la memoria. La inteligencia también está relacionada. La lista podría ampliarse. En la
práctica, un experimentador trata de controlar tantas variables destacadas como sea posible, con la esperanza
de que el efecto de los factores no controlados sea pequeño en relación con el efecto de la variable
independiente. Aunque siempre es importante ejercer un control estricto sobre los factores extraños, es aún
más crítico cuando la variable independiente produce un efecto pequeño sobre la variable dependiente.
Mantener una variable constante no es la única forma de eliminar la variación extraña. Las técnicas
estadísticas (discutidas más adelante en el capítulo) también controlan variables extrañas. Sin embargo,
mantener una variable constante es la técnica experimental más directa para controlar factores extraños, por
lo que limitamos nuestra definición de variables de control solo a esta técnica. Los resultados nulos a menudo
ocurren en un experimento porque no hay suficiente control de estos otros factores, es decir, se ha dejado
que varíen sistemáticamente con la variable independiente. Dependiendo de la relación entre una variable
extraña y una variable independiente, esta variación no controlada puede oscurecer o inflar el efecto de la
variable independiente sobre la variable dependiente de interés. El problema de la variación extraña ocurre
más a menudo en estudios que se llevan a cabo fuera de los laboratorios, donde la capacidad de mantener
constantes las variables de control se reduce considerablemente.
Debido a que comprender las variables independientes, dependientes y de control es tan importante, hemos
incluido algunos ejemplos para su uso al verificar su comprensión. Para cada situación, nombre los tres tipos
de variables. Las respuestas siguen los ejemplos.
¡Sin espiar!
1. Un fabricante de automóviles quiere saber qué tan brillantes deben ser las luces de freno para minimizar
el tiempo requerido para que el conductor de un automóvil que lo sigue se dé cuenta de que el automóvil de
adelante se está deteniendo. Se lleva a cabo un experimento para responder a esto. Nombra las variables.
RESPUESTAS
1 El género es un tipo especial de variable independiente llamada variable sujeto, que se analiza más adelante en este capítulo.
Los resultados de este experimento se muestran en la Figura 3.1, con cada variable independiente
representada por sí misma. Leer un pasaje de la Biblia produjo mayor agresión.
Los sujetos que creían en Dios también actuaron de forma más agresiva.
La figura 3.2 muestra que esta simple interpretación de los resultados, aunque correcta, es incompleta.
Aquí ambas variables independientes se trazan en el mismo gráfico, lo que hace que algunas relaciones
sean más fáciles de ver. Si no se menciona a Dios porque el pasaje proviene de un pergamino antiguo, los
sujetos que creen en Dios y los sujetos que no creen en Dios exhibieron niveles similares de agresión.
Pero cuando Dios sancionó la violencia porque el pasaje provenía de la Biblia, los sujetos que creen en
Dios exhibieron mayores niveles de agresión.
5 5
Agresión
0 0
Biblia Desplazarse Sí No
Agresión
5
0
Sí No
Creer en dios
ÿ FIGURA 3.3
Los resultados se muestran en la Figura 3.4, que traza el número de pensamientos generados
contra la identificabilidad para las dos condiciones de participación. La investigación anterior de
holgazanería social se replica en la condición de baja participación: se generaron menos pensamientos cua
10
Alto envolvimiento
9
pensamientos
Número
medio
de
7
Baja participación
Bajo Alto
identificabilidad
ÿ FIGURA 3.4
ÿ DISEÑOS EXPERIMENTALES
En cualquier diseño entre sujetos, el experimentador debe tratar de minimizar las diferencias
entre los sujetos en los dos o más grupos de tratamiento. Claramente, si tomamos los cinco mejores
memorizadores y los colocamos deliberadamente en el grupo de una repetición, y colocamos a los
cinco peores en el grupo de cinco repeticiones, podríamos terminar sin diferencias en los resultados,
incluso, quizás, con el grupo de una repetición lo hizo mejor. Para evitar este resultado, el
experimentador debe asegurarse de que ambos grupos sean equivalentes al comienzo del experimento.
Grupos equivalentes Una forma de garantizar la equivalencia sería administrar una prueba
de memoria a los 30 sujetos antes de que comenzara el experimento regular, para obtener una
medida de referencia de la capacidad de los sujetos para memorizar palabras sin sentido. Las
puntuaciones de referencia de los sujetos podrían usarse para formar parejas de sujetos que tuvieran
puntuaciones iguales o muy similares. Un miembro de cada par se asignaría aleatoriamente a un
grupo y el otro miembro al segundo grupo. Esta técnica se llama coincidencia. Una dificultad con el
emparejamiento es que un experimentador no puede emparejar sujetos en todas las características
posibles. Así, siempre existe la posibilidad de que los grupos, aunque emparejados en
Diseños intrasujetos
Muchos psicólogos experimentales preferirían el diseño dentro de los sujetos (un grupo) en el que los 30
sujetos fueran evaluados con una repetición y nuevamente con cinco repeticiones (o viceversa). Es más
eficiente, ya que cada sujeto se compara consigo mismo. Cualquier diferencia resultante de una versus
cinco repeticiones no puede ser el resultado de diferencias entre las personas en los dos grupos, como
podría ser el caso del diseño entre sujetos.
Efectos de la práctica general Existe un riesgo, sin embargo, en el diseño más eficiente dentro
de los sujetos. Imagine que los 30 sujetos primero aprenden una gran cantidad de elementos con cinco
repeticiones y luego aprenden con una repetición. Cuando los sujetos comienzan el tratamiento de una
repetición, es posible que se hayan vuelto más competentes en el aprendizaje de palabras sin sentido,
o que experimenten algo de aburrimiento o fatiga con la tarea. Ambas posibilidades se denominan
efectos de la práctica general. Por lo general, se supone que estos efectos son los mismos para todas
las condiciones de tratamiento, por lo que no importa si los sujetos aprendieron con una repetición
seguida de cinco repeticiones o cinco seguidas de una repetición. Debido a que los efectos de la práctica
general son los mismos para todas las condiciones de tratamiento, se pueden controlar en gran medida
mediante el contrapeso. Con el contrapeso, el experimentador se enfrenta a la dificultad de determinar
el orden en que se deben dar los tratamientos a los sujetos. Nuevamente, una solución es utilizar la
aleatorización sacando los títulos de los tratamientos de un sombrero, usando una tabla de números
aleatorios o usando una computadora para ordenar las condiciones al azar. La lógica detrás de esto se
discutió anteriormente. Sin embargo, aunque los tratamientos de contrapeso a través de la aleatorización
producen órdenes equivalentes a largo plazo, es menos probable que sean adecuados cuando solo hay
una pequeña cantidad de tratamientos. En la mayoría
Diseños de n pequeña
Antes de pasar a una discusión sobre diseños mixtos, nos gustaría mencionar una variante del
diseño tradicional dentro de los sujetos: el diseño de n pequeña . Los diseños de n pequeña
presentan los niveles de la variable independiente o los tratamientos a un pequeño número de
sujetos o a un solo sujeto. Debido a que se prueban pocos sujetos, se registra una cantidad sustancial
de observaciones para cada sujeto, lo que da como resultado un experimento muy económico y altamente
Los experimentos de n pequeña son comunes en el condicionamiento psicofísico, clínico y operante.
Diseños mixtos
Los experimentos no necesitan ser exclusivamente de diseño dentro de los sujetos o entre sujetos.
A menudo es conveniente y prudente tratar algunas variables independientes como entre sujetos y otras
como dentro de los sujetos en el mismo experimento (suponiendo que el experimento tenga más de una
variable independiente, por supuesto). Si una variable, por ejemplo, la administración de un fármaco,
parece probable que afecte a otras, puede convertirse en una variable entre sujetos, mientras que el resto
de las variables varían dentro de los sujetos.
Cuando los ensayos o la práctica repetida en una tarea son de interés, es necesariamente una variable
dentro de los sujetos. Con frecuencia, se utiliza un diseño mixto, en el que se impone alguna variable
entre los sujetos para ver su efecto en una segunda variable dentro de los sujetos. Este tipo de diseño de
compromiso (diseño mixto) no es tan eficiente o económico como un diseño puro dentro de los sujetos,
pero a menudo es más seguro.
Condiciones de control
El experimentador debe variar (o manipular) las variables independientes. Esto implica que todas y cada
una de las variables independientes deben variar en cantidad (variación cuantitativa) o en tipo (variación
cualitativa) dentro del experimento. Por ejemplo, si la cantidad de recompensa otorgada a una rata es una
variable independiente, las cantidades elegidas por el experimentador podrían ser una y cuatro gránulos
de comida. Alternativamente, podríamos ofrecer diferentes tipos de recompensas, como comida y agua.
El término técnico para un solo tratamiento o condición de una variable independiente es nivel. Diríamos
que los niveles de la variable independiente son una y cuatro bolitas de comida en el primer ejemplo y
comida y agua en el segundo ejemplo.
Muchos experimentos contienen, además de las variables independientes, algún grupo de control
(diseño entre sujetos) o condición de control (diseño dentro de los sujetos). En su forma más simple, el
grupo de control no recibe los niveles de interés de la variable independiente. En el ejemplo de recompensa
que acabamos de describir, un grupo de control de ratas no recibiría ninguna recompensa. O digamos
que un experimentador está interesado en el efecto del ruido en el estudio. Utilizando un diseño entre
sujetos, el experimentador expondría a un grupo de sujetos a un ruido fuerte durante media hora mientras
estudiaban; este es el nivel de interés de la variable independiente. Un grupo de control estudiaría el
mismo material durante media hora en un ambiente tranquilo (un nivel muy bajo de ruido). Luego, ambos
grupos serían probados en el material. Cualquier diferencia obtenida en la prueba entre los dos grupos se
atribuiría al efecto del ruido.
La característica importante de una condición de control es el hecho de que proporciona una línea
de base contra la cual se puede comparar alguna variable de interés. A veces, la mejor línea de base es
ningún tratamiento, pero a menudo la mejor línea de base requiere algo de actividad. Un ejemplo frecuente
ocurre en la investigación de la memoria, donde se requiere que un grupo de sujetos aprenda dos listas
diferentes de palabras. El experimentador está interesado en cómo el aprendizaje de una lista interfiere con
ÿ FIGURA 3.5
aprendiendo del otro. El grupo experimental (que recibe el nivel de interés de la variable independiente)
primero aprende la lista A, luego aprende la lista B y luego se prueba nuevamente en la lista A.
Al experimentador le gustaría demostrar que aprender la lista B interfiere con la retención de la lista A.
Pero antes de que se pueda llegar a una conclusión de este tipo, se requiere una condición de control
de comparación. Simplemente comparar la prueba final de la lista A con la primera prueba es
insuficiente, porque los sujetos pueden obtener peores resultados en la última prueba de la lista A
simplemente porque están cansados, o pueden hacerlo mejor porque han tenido práctica adicional.
Una condición de control sin tratamiento haría que un grupo de control aprendiera la lista A, luego se
sentara durante el tiempo que le tomó al grupo experimental aprender la lista B, y luego se probaría
nuevamente en la lista A. Pero esta sería una condición de control deficiente, porque los sujetos
podrían practicar o ensayar la lista A mientras estaban sentados. Esto mejoraría su desempeño final
en la última prueba de la lista A y haría parecer incorrectamente que en el grupo experimental, la lista
B interfirió más de lo que realmente interfirió con la lista A. Una condición de referencia adecuada
ocuparía al grupo de control durante el tiempo que duró la prueba. el grupo estaba aprendiendo la lista
B; tal vez el experimentador les pediría que hicieran aritmética o algún otro "trabajo pesado" que evitaría el e
A veces, la condición de control está contenida implícitamente dentro del experimento.
Recuerde el experimento de memoria discutido anteriormente, en el que la variable independiente era
el número de repeticiones de un elemento: uno o cinco. Ningún experimentador se molestaría en incluir
un grupo de control o condición con cero repeticiones, ya que no podría ocurrir ningún aprendizaje bajo
esta extraña circunstancia. La condición de control está implícita, en el sentido de que cinco repeticiones
pueden compararse con una, y viceversa. Dado que el experimentador podría estar tan interesado en
los efectos de una sola repetición como en cinco repeticiones, probablemente no llamaríamos
explícitamente al nivel de una repetición una condición de control. Pero proporciona una línea de base
para la comparación, y lo mismo ocurre con la condición de cinco repeticiones, ya que los resultados
de una repetición se pueden comparar con ella.
Muchos tipos de experimentos requieren más de una línea base. En la investigación fisiológica y
de fármacos, por ejemplo, se necesita un control para traumatismos quirúrgicos o por inyección.
Entonces, un sujeto podría recibir una operación simulada o la inyección de una sustancia inerte (un
placebo) en la condición de control; también se compararían con otros controles que no recibieron
ninguna operación ni inyección.
Trampas
Cuasi-Experimentos
Por una razón u otra, muchas variables no se pueden manipular directamente. Un impedimento
para la manipulación de variables en los experimentos son las consideraciones éticas que todos
los científicos deben tener (ver Capítulo 4). Es ético inspeccionar u observar de otro modo el uso
de drogas por parte de estudiantes universitarios, siempre que se obtenga el permiso. Sin
embargo, ni mucho menos sería ético crear un grupo de drogadictos y comparar sus actividades
con un grupo que no abusa que también creamos. Una segunda barrera a la manipulación es la
Madre Naturaleza. Algunas variables, como el sexo de nuestros sujetos, no pueden ser
modificadas por el experimentador (excepto en circunstancias muy raras y controvertidas); otras
variables, como los desastres naturales (tornados, huracanes) o no naturales (guerras, accidentes
aéreos), son tanto física como moralmente difíciles de implementar. ¿Podemos hacer
experimentos que se refieran a estos fenómenos? Después de todo, tales variables y otras
similares son fascinantes y pueden desempeñar un papel importante en la experiencia humana.
La respuesta a la pregunta (suponiendo que sea un científico ético) es esta: puede y no
puede. No estamos siendo tontos aquí; más bien, estamos enfatizando el hecho de que no se
pueden hacer experimentos reales sobre fenómenos como los que acabamos de enumerar. Sin
embargo, puede realizar cuasi-experimentos. La técnica aquí es similar al examen ex post
facto en la investigación correlacional, excepto que se examinan dos o más niveles de la variable
de interés en lugar de correlacionarlos. Esperamos que la Madre Naturaleza haga su trabajo y
luego comparamos los efectos de esa “variable independiente” con los efectos que ocurren
cuando esa variable no está presente o difiere de alguna manera. Si comparamos la capacidad
lectora de los hombres con la de las mujeres, o la de los lectores rápidos con la del adulto medio,
hemos realizado un cuasi-experimento.
Las ventajas de los cuasi-experimentos son obvias: utilizan variables independientes que
ocurren naturalmente, la mayoría de las cuales tienen un alto grado de interés intrínseco e
importantes implicaciones prácticas. En un cuasi-experimento, aprovechamos los procedimientos
de observación y correlación y los combinamos con el poder de la experimentación. El cuasi-
experimento típico tiene una variable sujeto como variable independiente. Si queremos averiguar
acerca de casi cualquier variable inherente del sujeto (edad, sexo, raza, grupo étnico), atributo
del sujeto socialmente causado (clase social, región de residencia) o atributo del sujeto
relacionado con enfermedades y enfermedades (pérdida de extremidades, enfermedad mental,
daño cerebral, efectos de desastres), vamos a tener que seleccionar en lugar de variar nuestras
variables independientes, a menos que sea posible hacer el experimento directamente en organism
Aunque los cuasi-experimentos son interesantes y pueden contribuir a una investigación muy
importante, debemos advertirle aquí que las ventajas de los cuasi-experimentos se obtienen a
expensas del control. Cuando el investigador tiene que tomar lo que se le da, lo que se le da
puede incluir varias variables de confusión importantes.
Varios problemas bastante graves están asociados con el emparejamiento. Por un lado, a
menudo requiere mucho esfuerzo, porque algunas de las variables relevantes pueden ser bastante
difíciles de medir. Incluso cuando uno se toma la molestia de tomar las medidas adicionales necesarias,
aún puede ser imposible emparejar los grupos, especialmente si hay pocos sujetos involucrados antes
de intentar el emparejamiento. Incluso cuando el emparejamiento es exitoso, a menudo reduce en
gran medida el tamaño de la muestra en la que se realizan las observaciones. Entonces tenemos
menos confianza en nuestras observaciones, porque pueden no ser estables y repetibles.
El emparejamiento es a menudo difícil porque las diferencias cruciales entre los sujetos pueden
tener efectos sutiles. Además, los efectos de una diferencia pueden interactuar con otra. Por lo tanto,
las interacciones sutiles entre las variables emparejadas pueden confundir los resultados. Para ilustrar
estas dificultades, consideremos parte del trabajo realizado por Lester y Brazelton (1982) sobre el
comportamiento neonatal.
El principal interés de Brazelton está en las diferencias culturales en el comportamiento neonatal,
medido por la Escala de Evaluación del Comportamiento Neonatal de Brazelton. La estrategia general
es comparar neonatos de varias culturas y grupos étnicos con neonatos de los Estados Unidos. En
estos cuasi-experimentos, la cultura o el grupo étnico, que es una variable del sujeto, es la variable
cuasi-independiente. Por lo general, se intenta emparejar a los bebés de diferentes culturas a lo largo
de varias dimensiones, como el peso al nacer, la longitud al nacer y el riesgo obstétrico (incluido si la
madre recibió medicamentos durante el parto, si el bebé fue prematuro, etc.). Lester y Brazelton
muestran que existe una relación sinérgica entre estos factores. Sinergismo en un contexto médico
significa que los efectos combinados de dos o más variables no son aditivos: el efecto combinado es
mayor que la suma de los componentes individuales. Esto significa que las variables interactúan.
¿Cómo afecta la regresión hacia la media a los cuasi-experimentos, en los que los sujetos han sido
emparejados en alguna variable? Nuevamente, considere un ejemplo. Esta, como muchas investigaciones
ex post facto realizadas sobre problemas sociales aplicados, tiene implicaciones importantes. Supongamos
que tenemos un programa educativo que creemos que será especialmente ventajoso para aumentar los
puntajes de lectura de los niños afroamericanos. Esto es especialmente importante porque los puntajes
de los niños afroamericanos suelen ser más bajos que los de los blancos, presumiblemente debido a los
diferentes entornos culturales. Tomamos dos grupos de niños, uno afroamericano y otro blanco, y los
emparejamos según varios criterios, incluidos la edad, el sexo y, lo que es más importante, el rendimiento
inicial en lectura. Damos a ambos grupos de niños el programa de mejoramiento de la lectura y luego
evaluamos sus puntajes de lectura después del programa. Encontramos, para nuestra sorpresa, que los
niños afroamericanos se desempeñan peor después del programa de lectura que antes, y los niños
blancos mejoran. Concluimos, por supuesto, que el programa
Es probable que se hubiera obtenido el mismo resultado si los niños hubieran sido emparejados
en CI en lugar de puntajes de lectura, ya que los dos probablemente están correlacionados
positivamente. Así que simplemente encontrar otra variable coincidente puede no ser una solución.
Una solución sería unir muestras muy grandes de niños afroamericanos y blancos y luego dividir cada
grupo, dando el programa de lectura a un subgrupo pero no al otro. Todos se volverían a probar al final
de la participación de un subgrupo en el programa. (La asignación de sujetos a los subgrupos de niños
afroamericanos y blancos debería, por supuesto, ser aleatoria.) Se esperaría una regresión a la media
en ambos subgrupos, pero el efecto del programa de lectura podría evaluarse contra el grupo que tenía
ningún programa
Tal vez los niños afroamericanos con el programa de lectura mostrarían una caída mucho menor
(regresión a la media) que los que no lo tenían, lo que indica que el programa realmente tuvo un efecto
positivo.
Debido a que la investigación cuasi-experimental con variables temáticas se lleva a cabo bastante
a menudo para evaluar programas educativos, sus practicantes deben ser conscientes de los muchos
problemas espinosos asociados con su uso. Es posible que uno no pueda decir mucho con respecto a
los resultados o sacar conclusiones importantes debido a las confusiones. El emparejamiento ayuda a
aliviar este problema en algunos casos donde su uso es posible, pero luego se introduce la posibilidad
de artefactos de regresión. Y muchos investigadores parecen no darse cuenta de este problema. En el
capítulo 12 se analiza un error famoso en este tipo de investigación evaluativa, muy similar al estudio
hipotético descrito aquí.
Cuando el emparejamiento es una posibilidad práctica y cuando se evalúan los artefactos de
regresión, podemos sentirnos un poco más seguros de las conclusiones de nuestros resultados. Pero
debemos recordar que lo que tenemos todavía es solo una correlación, aunque muy cuidadosamente
controlada. La combinación es a veces útil, pero no es una panacea. En nuestro ejemplo anterior
comparando sujetos esquizofrénicos con otros en el desempeño de la prueba mental, si los
esquizofrénicos todavía se desempeñaron peor que el nuevo grupo de control emparejado, ¿podríamos
entonces concluir que la esquizofrenia produjo inferioridad en el uso del lenguaje? No, no pudimos.
Todavía podría ser otra cosa, alguna otra diferencia entre los dos grupos. Nunca podemos estar
absolutamente seguros de haber coincidido con las variables relevantes.
El estudio del diseño experimental es complejo. En la mayoría de los capítulos, incluimos una
característica, Del problema al experimento, que explica cómo convertir un problema o pregunta en un
experimento real. A continuación describimos esta característica.
Otro problema para el nuevo investigador está relacionado con la “tradición del laboratorio”.
“Todo el mundo” sabe que hay ciertas formas “obvias” de realizar ciertos tipos de investigación.
Estas formas difieren de un área a otra, pero son bien conocidas dentro de cada categoría.
Son tan conocidos que los investigadores rara vez se molestan en explicarlos y, de hecho, se
sorprenden bastante cuando los nuevos investigadores ignoran estos trucos y técnicas "obvios".
Los investigadores de animales a menudo privan a los animales de comida durante varias
horas antes del experimento o mantienen a sus palomas en un cierto porcentaje del peso que
alcanzarían si tuvieran comida disponible continuamente. Aunque las razones de esto son
obvias para el investigador, pueden no serlo para usted. ¿Cómo sabe un experimentador
cuántos elementos usar en un experimento de memoria? ¿Cuánto tiempo debe durar un
experimento? ¿Por qué se selecciona una variable dependiente de un conjunto de lo que
parecen ser variables dependientes igualmente válidas? ¿Cuántos sujetos se deben utilizar en
un experimento? Las secciones Del problema al experimento en los capítulos de la Parte dos
responderán preguntas tan "obvias" como estas.
Del problema a la hipótesis Un problema es, más o menos, un enunciado vago que debe ser
verificado o una pregunta que debe ser respondida. A menos que se haga específico y preciso, no se
puede probar experimentalmente. Cualquier hipótesis es una predicción particular, derivada de un
problema, a menudo expresada de esta forma: si A, entonces B. La distinción crucial entre un
problema y una hipótesis es que una hipótesis es directamente comprobable, mientras que un
problema no lo es. Una prueba experimental debe ser capaz de refutar una hipótesis.
El propósito de cualquier experimento es probar hipótesis sobre los efectos de una(s) variable(s)
independiente(s) sobre la variable dependiente. Para ello, debemos recopilar datos. Una vez
obtenidos, estos datos deben ser analizados. Una vez analizados, los datos deben ser reportados.
Discutimos brevemente estos aspectos a su vez.
ÿ DATOS
Obtención de datos
Delinear un diseño experimental no establece todas las condiciones necesarias para la adquisición
de datos. Aunque el diseño le dice cómo asignar sujetos a los experimentos, no le dice cómo obtener
los sujetos. Sin sujetos, no hay datos.
Los psicólogos que investigan el comportamiento animal tienen mucho más control sobre la
selección de sujetos que los que estudian a los humanos. Aunque los psicólogos animales deben
asumir el gasto adicional de obtener vivienda y alimentar a sus sujetos, pueden seleccionar la
variedad que desean comprar y siempre tener sujetos disponibles, salvo alguna catástrofe.
La investigación con humanos utiliza con mayor frecuencia como sujetos a estudiantes
universitarios matriculados en psicología introductoria. Siempre que esta participación se utilice como
una experiencia de aprendizaje para el estudiante, se considera ético y adecuado (American
Psychological Association [APA], 1987). Si el experimento no se utiliza como una experiencia de
aprendizaje, el experimentador debe pagar sujetos. Dado que los estudiantes universitarios son una
población selecta, los experimentadores deben tener cuidado al generalizar los resultados a otras
poblaciones de sujetos. Por ejemplo, las técnicas de un sistema de aprendizaje programado diseñado
para enseñar química inorgánica podrían no tener éxito en la enseñanza de la plomería.
La selección aleatoria significa que cualquier miembro de una población tiene las mismas
posibilidades de ser seleccionado como participante. Además, cada selección es independiente de
otras selecciones, por lo que elegir a una persona no afecta las posibilidades de seleccionar a otra
persona. A veces, en un experimento típico de psicología, puede ser difícil especificar la población
que se está muestreando (Gigerenzer, 1993). Incluso si las materias pueden seleccionarse al azar,
¿qué población representa exactamente un grupo de materias universitarias? Ni siquiera está claro
si la población de estudiantes que toman los cursos de psicología requeridos es representativa de
todos los estudiantes universitarios. Dado que la población estudiantil ahora es tan diversa y
representa a personas con edades y antecedentes muy diferentes, los investigadores deben tener
cuidado al extrapolar los resultados de la muestra de prueba a otras poblaciones.
Asignación aleatoria significa que cada participante en el experimento es asignado
aleatoriamente a los tratamientos experimentales (Holland, 1993). Esta es una técnica prudente.
Análisis de datos
El resultado inmediato de un experimento es una gran serie de números que representan el comportamiento
en diferentes condiciones. Como Sidman (1960) lo describe con humor, los científicos creen que todos los
datos están contaminados al nacer. Los datos pertenecen al azar oa la ciencia, pero nunca a ambos.
Antes de que el psicólogo pueda estar seguro de que los datos pertenecen a la Ciencia, el demonio Azar
debe ser exorcizado. Esto se hace mediante un ritual llamado análisis estadístico inferencial.
Una vez que el análisis estadístico le dice qué datos son confiables (no se produjeron por casualidad),
todavía tiene que decidir qué datos son importantes. Ningún cálculo matemático puede decir qué hipótesis
se están probando, qué predicen las teorías, etc.
Las estadísticas nunca sustituyen al pensamiento. El análisis estadístico es un procedimiento teóricamente
neutral que sirve para probar teorías e hipótesis. Excepto en el caso de un experimento hipotético, las
teorías y las hipótesis preceden a las estadísticas.
Debido a que es virtualmente imposible comprender el significado del gran conjunto de números que
produce un experimento, los datos generalmente se condensan mediante estadísticas descriptivas. Los más
comunes son la media y la desviación estándar. Como parte del análisis de datos, se calculan las medias
para cada nivel de cada variable independiente, así como para combinaciones de variables independientes
para mostrar interacciones.
Informe de datos
Los datos se presentan en tablas o figuras. Las figuras suelen ser más fáciles de entender.
La figura 3.2 es un ejemplo típico de cómo se informan los resultados de un experimento. La variable
dependiente se representa en la ordenada, la escala vertical. La variable independiente se grafica en la
abscisa, la escala horizontal. Más de un independiente
ÿ RESUMEN
1. Un experimento es un procedimiento controlado para investigar variación extraña. En un diseño entre sujetos,
los efectos de una o más variables independientes sobre una diferentes grupos de sujetos experimentan diferentes
o más variables dependientes. La variable independiente es tratamientos. En un diseño intra-sujetos, los mismos sujetos
manipulada por el experimentador, mientras que la variable pasan por todos los tratamientos. El diseño entre sujetos es
dependiente es observada y registrada. Los experimentos más seguro, pero el diseño dentro de los sujetos es más
ofrecen al investigador la mejor oportunidad de eliminar o eficiente. Los diseños mixtos tienen algunas variables
minimizar la variación extraña. Los experimentos se realizan dependientes que son entre sujetos y otras que son intra-
para probar teorías, para replicar y expandir hallazgos previos, sujetos. En los diseños entre sujetos, los grupos equivalentes
o para mostrar que no se puede confirmar la investigación se forman mediante emparejamiento y aleatorización. Efectos
previa. de la práctica general
Solo en raras ocasiones se realizan experimentos solo para y los efectos de arrastre diferenciales en los diseños dentro de
ver qué podría suceder. los sujetos se evalúan pero no se eliminan mediante el
2. Las variables independientes se eligen porque un experimentador contrapeso. Las condiciones de control proporcionan una línea
piensa que controlarán el comportamiento. Si no lo hacen, esto de base clara contra la cual se pueden comparar las condiciones
puede significar que la manipulación fue inadecuada o que el de interés.
experimentador se equivocó. Las variables dependientes deben 5. Hay muchas trampas en el diseño experimental.
ser estables, es decir, deben producir de manera consistente Las características de la demanda resultan del conocimiento
los mismos resultados bajo las mismas condiciones. Los del sujeto de que está participando en un experimento. Los
efectos techo y suelo resultan de un rango inadecuado para la efectos del experimentador son artefactos introducidos
variable dependiente. Las variables de control son posibles accidentalmente, cuando el experimentador (a través del
variables independientes que no se manipulan durante un comportamiento o las características individuales) proporciona
experimento. pistas sobre el propósito del experimento o influye en el sujeto
3. La mayoría de los experimentos prueban más de una variable sistemáticamente.
independiente a la vez. Además de proporcionar economía, Los efectos del experimentador se pueden minimizar mediante
esto permite que el experimentador obtenga información el uso de maquinaria para evitar diferencias sutiles en el
importante sobre las interacciones. Ocurren interacciones comportamiento del experimentador.
cuando los efectos de una variable independiente no son los 6. La selección de participantes de alguna población se denomina
mismos para diferentes niveles de otra variable independiente muestreo. El muestreo aleatorio significa que cada miembro
variable pendiente. Ocasionalmente, los experimentos usan de la población tiene la misma oportunidad de ser seleccionado.
más de una variable dependiente. Es más eficiente probar sujetos en grupos, pero se debe tener
4. El diseño experimental asigna sujetos a diferentes condiciones cuidado para evitar contaminar el experimento.
de manera que se espera que minimicen
ÿ TÉRMINOS CLAVE
abscisa
base Interacción
nivel
diseño entre sujetos
Efecto techo pareo
condición de control diseño mixto
resultados nulos
grupo de control
control variable ordenada
contrapeso cuasi-experimentos
experimento crítico asignación aleatoria
datos Selección aleatoria
características de la demanda aleatorización
1. Diseña un experimento para descubrir por qué a los plomeros se les ilustrar la interacción y la falta de interacción. Etiqueta
paga más que a los profesores universitarios. Tome una muestra cuidadosamente sus gráficos.
aleatoria de plomeros y profesores. Haga que la mitad de cada 4. Explique la cita de Beveridge al comienzo de este capítulo.
grupo realice el trabajo de la otra ocupación, mientras que la otra
ocupación (a) observa en silencio o (b) ofrece consejos. Nombre 5. Supón que quisieras determinar si las personas con narices largas
las variables dependientes, independientes y de control que tienen mejor sentido del humor que las personas con narices más
seleccionaría para este experimento. ¿Cuáles son algunos de los cortas. La longitud de la nariz es, por supuesto, una variable del
problemas de diseño asociados con tal experimento? sujeto. Decides dar a dos grupos de personas con narices de
diferente tamaño una serie de 20 chistes (que los expertos han
2. Transforme cada uno de los siguientes problemas o enunciados en calificado como excelentes) para ver si les gustan más a las
al menos dos hipótesis comprobables: personas con narices largas que a las de narices cortas. ¿Qué
(a) No puedes enseñarle nuevos trucos a un perro viejo. pasos tomaría para asegurarse de que alguna otra variable no se
(b) Comer comida chatarra baja tu calificación confundiera con la longitud de la nariz en sus dos grupos de
promedio. personas? ¿Cómo haría para seleccionar a las personas para el
(c) Un centavo ahorrado es un centavo ganado. estudio, suponiendo que tuviera 200 personas para quienes tuviera
(d) La mejor manera de estudiar es abarrotar la noche medidas de la longitud de la nariz y muchas otras características?
antes de un examen.
CONEXIONES WEB
Explore la presentación paso a paso de "Experimentos verdaderos" en las actividades del Centro
de Recursos de Psicología de Wadsworth, Estadísticas y Métodos de Investigación en:
http://academic.cengage.com/psychology/workshops
Puede encontrar un curso completo de métodos de investigación con numerosos enlaces a una
variedad de temas importantes en psicología experimental en:
http://trochim.human.cornell.edu
Puede encontrar un conjunto de experimentos en línea galardonados en:
www.psychologie.unizh.ch/somi/ulf/lab/webexppsylab.html
CAPÍTULO 4
ÉTICA EN
PSICOLÓGICO
INVESTIGAR
Confidencialidad
FRAUDE CIENTÍFICO
MONITOREO DE PRÁCTICAS ÉTICAS
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
LECTURAS SUGERIDAS
PSICOLOGÍA EN ACCIÓN: COMPRENSIÓN
Y RECORDANDO LOS FORMULARIOS DE CONSENTIMIENTO
La cita que introduce este capítulo está tomada de una publicación de la Asociación Americana de
Psicología (APA). Proviene de un preámbulo de una larga discusión sobre los principios éticos que cubren
todos los aspectos de la psicología y se presenta aquí de forma abreviada para enfatizar las obligaciones
éticas de los investigadores en todas las áreas de la ciencia. Estas obligaciones son sencillas en principio
pero difíciles de implementar. Examinamos tanto los principios éticos como los problemas asociados con su
puesta en práctica en psicología. Los psicólogos se preocupan por la ética de la investigación en la que
participan tanto seres humanos como animales. Aunque parte de esta preocupación es egoísta, debido al
temor a la restricción de los fondos de investigación y la pérdida de acceso a las poblaciones de sujetos, la
mayoría de los psicólogos son personas éticas que no desean causar daño a nadie.
Un experimentador no puede ser completamente imparcial y objetivo al juzgar las cuestiones éticas
relacionadas con su propia investigación, por lo que la mayoría de las universidades e instituciones de
investigación tienen comités de pares que juzgan la ética de la investigación propuesta. De hecho, dicho
comité debe aprobar cualquier investigación financiada con fondos federales antes de que se otorguen los fon
Varias cuestiones éticas se vuelven obvias en el contexto de un proyecto de investigación real.
Imagine que es un psicólogo interesado en determinar hasta qué punto los sentimientos depresivos influyen
en la forma en que las personas recuerdan. Una razón muy importante por la que desea estudiar este tema
es que la depresión es un problema emocional bastante común entre los estudiantes universitarios y le
gustaría determinar cómo este problema podría afectar el rendimiento académico. Decides hacer un
experimento de laboratorio estrictamente controlado para determinar los efectos de la depresión en la
memoria. Desea inducir la depresión en algunos de sus participantes y luego comparar su memoria con la
de otros que no fueron inducidos a estar deprimidos. Usted induce depresión en sus participantes mediante
un procedimiento ideado por Velten (1968). En este procedimiento, las personas leen en voz alta 60
declaraciones autorreferentes asociadas con el estado de ánimo en cuestión. En este caso, el participante
lee afirmaciones que se supone inducen a la depresión, comenzando con unas relativamente leves, como
“Hoy no es ni mejor ni peor que cualquier otro día”, y progresando a otras más extremas, como “Me siento
tan malo que quisiera irme a dormir y nunca despertar.” El procedimiento de Velten induce una depresión
temporal leve; los participantes informan sentirse deprimidos y su comportamiento se resiente en una
variedad de tareas.
No se han especificado muchos detalles de este experimento, pero debería ser obvio que el bienestar
de los participantes de la investigación en este estudio podría estar en peligro (para obtener detalles
completos de este experimento, consulte Elmes, Chapman y Selig, 1984). Inducir un estado de ánimo
negativo (como la depresión) en estudiantes universitarios podría tener efectos desastrosos en su
funcionamiento social e intelectual. ¿Cómo puede usted, como investigador ético, tratar de preservar y
proteger los derechos humanos fundamentales de sus participantes? ¿Qué haría para proteger su bienestar
y al mismo tiempo realizar un experimento válido internamente?
8.01 Aprobación institucional Cuando 8.03 Consentimiento informado para grabar voces e imágenes
se requiere la aprobación institucional, los psicólogos brindan información precisa en la investigación Los psicólogos obtienen el consentimiento
sobre sus propuestas de investigación y obtienen la aprobación antes de realizar informado de los participantes de la investigación antes de grabar sus voces o
la investigación. Llevan a cabo la investigación de acuerdo con el protocolo de imágenes para la recopilación de datos a menos que (1) la investigación consista
investigación aprobado. únicamente en observaciones naturales en lugares públicos, y no se prevé que
la la grabación se usará de una manera que podría causar identificación personal
8.02 Consentimiento informado para la investigación o daño, o (2) el diseño de la investigación incluye engaño, y el consentimiento
(a) Al obtener el consentimiento informado como se requiere en el para el uso de la grabación se obtiene durante el interrogatorio. (Consulte también
Estándar 3.10, Consentimiento informado, los psicólogos informan a el Estándar 8.07, Engaño en la investigación).
8.07 Engaño en la investigación (a) (b) Si los valores científicos o humanos justifican retrasar o retener esta
Los psicólogos no realizan un estudio que involucre engaño a menos información, los psicólogos toman medidas razonables para reducir el riesgo
que hayan determinado que el uso de técnicas engañosas está justificado de daño.
por el valor científico, educativo o aplicado prospectivo significativo del
(c) Cuando los psicólogos se dan cuenta de que los procedimientos de
estudio y que los procedimientos alternativos efectivos no engañosos son
investigación han dañado a un participante, toman medidas razonables para
necesarios. no factible. minimizar el daño.1
Libertad de retiro
Como se mencionó brevemente en la sección anterior, los participantes deben poder negarse a
participar o retirarse en cualquier momento. Además, pocas personas negarían que las personas que
no están contentas con participar deberían tener la libertad de retirarse.
¿Dónde, entonces, está el dilema ético? El principal problema gira en torno a la definición de un
participante voluntario dispuesto. Considere el grupo de sujetos para el experimento de depresión y
memoria: estudiantes universitarios (en su mayoría estudiantes de primer y segundo año) que toman
psicología introductoria. Se registran para participar en experimentos y, por lo general, reciben algún
tipo de crédito de curso por su servicio. ¿Se ofrecen como voluntarios cuando se inscriben o están bajo
algún tipo de coerción que han inferido de la situación? Si los estudiantes realmente reciben crédito
adicional, es probable que actúen por su propia voluntad. Si deben participar como parte de un requisito
del curso, entonces el
Confidencialidad
Lo que hace una persona en un experimento debe ser confidencial a menos que se acuerde lo contrario.
Un investigador ético no anda diciendo cosas como “Bobby Freshman es estúpido; lo hizo peor
que nadie en mi experimento”. Además, la información personal sobre participantes particulares, como
sus actitudes hacia el sexo prematrimonial o los ingresos familiares, no debe revelarse sin su permiso.
El principio de confidencialidad parece sencillo, pero un investigador puede enfrentarse a un dilema
ético cuando trata de mantener la confidencialidad.
Este tipo de dilema se presenta con frecuencia en la investigación. Para adherirse a un principio
ético puede ser necesario violar otro. Las opciones fáciles se desvanecen cuando esto sucede.
En el caso que mencionamos, si los estudiantes muy deprimidos hubieran sospechado que el
investigador había traicionado su confianza, se podría haber producido un resentimiento y una
desconfianza permanentes.
Como ilustra nuestro ejemplo, las decisiones éticas a veces deben tomarse sobre la base de
preocupaciones pragmáticas. En otras palabras, las personas involucradas en la toma de decisiones
sobre un proyecto de investigación deben concentrarse en cómo proteger mejor a los participantes y, al
mismo tiempo, realizar un proyecto significativo y válido. La responsabilidad de la práctica ética recae
en el investigador, las juntas de revisión y los editores de revistas que revisan la investigación para su pub
En casos limitados, un investigador podría justificar el engaño, el ocultamiento y la violación de la
confidencialidad. Sin embargo, tales prácticas éticas cuestionables deben evitarse en la medida de lo
posible. Las violaciones éticas no son requisitos previos de una buena investigación.
Aunque la mayor parte de la investigación en psicología contemporánea se centra en los seres humanos,
un número apreciable de estudios se centran en los animales (Miller, 1985). Los animales a menudo se
utilizan para responder preguntas que serían imposibles o poco prácticas de responder utilizando seres
humanos. Algunas personas creen, sin embargo, que los animales no deben usarse en varios tipos de
investigación (Bowd, 1980). Por ejemplo, Rollin (1985) ha argumentado que si el concepto de derechos
legales y morales se puede aplicar a la investigación humana, también se puede aplicar de la misma
manera a la investigación animal. Sugirió que el estatus de la investigación con animales debe elevarse
al de sujetos humanos, con muchas de las mismas reglas que rigen la investigación humana aplicadas
a los animales. Los informes en los medios han discutido el supuesto maltrato de los animales de
laboratorio y los intentos de los defensores de los derechos de los animales de limitar el uso de animales
en la investigación. Por lo tanto, es importante considerar por qué se utilizan animales en la investigación
y es necesario comprender las salvaguardias éticas para los animales.
Los animales también son objeto de investigación porque son interesantes y porque forman una
parte importante del mundo natural. El número de observadores de aves y otros naturalistas aficionados,
así como los numerosos psicólogos comparativos y etólogos, dan fe del interés. Sin embargo, más
importante en términos de preocupaciones éticas es que los animales sirven como modelos convenientes
y altamente controlados para los humanos y otros animales. La APA (2003b) proporciona información
adicional sobre el uso de animales en la investigación psicológica.
La ética prohíbe el daño cerebral inducido experimentalmente en seres humanos, excluye la separación
deliberada de un bebé humano de sus padres, prohíbe probar drogas desconocidas en seres humanos
y, en general, excluye manipulaciones peligrosas e irreversibles en seres humanos. Los defensores de
los derechos de los animales creen que la investigación con animales debería tener las mismas
prohibiciones. Según los defensores de los derechos de los animales, los investigadores deben defender
los derechos tanto de los seres humanos como de los animales porque, por ejemplo, creen que la
destrucción experimental del cerebro de un mono es tan éticamente reprobable como la destrucción del
cerebro de un ser humano. Tres puntos resumen los derechos de los animales
El primer punto es que los animales sienten dolor y sufrimiento. Ciertamente, esto es cierto, pero existen
estándares éticos en todas las disciplinas científi cas que utilizan animales como sujetos de investigación.
Una parte importante de estos principios se refiere a la proscripción del dolor indebido y el trato inhumano.
Ningún psicólogo ético infligiría deliberadamente un daño indebido a un animal.
Cuando se inflige dolor y sufrimiento a un animal, es solo después de una deliberación considerable por
parte del científico y las juntas de revisión de ética correspondientes. Tales deliberaciones sopesan el
sufrimiento del animal contra los beneficios potenciales del experimento. Sólo cuando los beneficios superan
con creces los daños se aprueba y se lleva a cabo el experimento.
Finalmente, un punto importante a destacar sobre la investigación del comportamiento en animales es que
gran parte de ella no implica dolor o daño físico para ellos.
El segundo punto de la plataforma de los derechos de los animales es que la destrucción de cualquier
ser vivo deshumaniza al científico humano. Presumiblemente, las plantas no deben incluirse aquí, ya que,
como seres humanos, debemos destruir las plantas, si no los animales, para sobrevivir. Incluso si esta
prohibición de matar seres vivos se limita a los animales, tiene una serie de implicaciones graves más allá de
la eliminación de la investigación con animales. Si uno usa este argumento en contra de la investigación con
animales, entonces no debe comer carne de ningún tipo. Asimismo, no se debe utilizar ningún producto
derivado de la destrucción de animales (p. ej., cuero).
Finalmente, si la destrucción de animales es deshumanizante, ¿no es también deshumanizador beneficiarse
de la destrucción de animales? Si es así, entonces un verdadero creyente en los derechos de los animales
debería abandonar la mayoría de las maravillas de la medicina moderna porque prácticamente todas se
beneficiaron de la investigación con animales. Sin embargo, la adhesión constante a una creencia en los
derechos de los animales suele ser difícil. La dificultad quedó ilustrada en los resultados de una encuesta de
activistas que asistieron a una gran manifestación en apoyo de los derechos de los animales (Plous, 1991).
Plous informa que un porcentaje sustancialmente mayor de activistas afirma ser vegetariano o vegano
(personas que no comen productos de origen animal, incluidos la leche y los huevos) que la gente en general.
Muchos activistas dicen que no usan artículos de cuero. Sin embargo, la mayoría de los activistas por los
derechos de los animales (53 por ciento) informan que compran artículos de cuero, ingieren carne de animales o a
Finalmente, existe la acusación de que el progreso científico a expensas de los animales es simplemente
especismo, la creencia de que el sacrificio de miembros de otras especies está justificado si nuestra especie
se beneficia. Como crítica contra la investigación con animales, este argumento ignora el hecho de que una
cantidad significativa de la investigación con animales beneficia el bienestar de los animales. Por ejemplo,
Miller (1985) señala que la investigación sobre la aversión al gusto aprendida en ratas ha llevado a nuevos
medios no letales para mantener a los coyotes alejados de las ovejas y a los cuervos de los cultivos. De
manera similar, la investigación sobre la impronta de los patos recién nacidos a los cuidadores humanos
condujo a una mejor preparación de los polluelos de cóndor incubados artificialmente para la naturaleza.
En cualquier caso, incluso si utilizar animales en beneficio de los seres humanos es una forma de
especismo, es dudoso que muchas personas renuncien a los beneficios ya logrados o
Mientras escribo este artículo, revivo mis vívidas experiencias de ayer cuando extirpé en la operación
un gran tumor del cerebelo y el tronco encefálico de un niño pequeño. Esta fue una empresa quirúrgica
que habría sido imposible hace unas décadas, muy peligrosa hace unos años, pero hoy en día,
gracias a la extensa experimentación en los cerebros de animales inferiores, se lleva a cabo
rutinariamente con un alto grado de seguridad. (1971, pág. 504)
Los psicólogos se han centrado en el trato humano y ético de los animales utilizados en la investigación
durante mucho tiempo (Greenough, 1992). Por ejemplo, una de las primeras declaraciones sobre el trato
humanitario (Young, 1928) afirmaba que los animales utilizados como sujetos de investigación tratados
“. . . serán
amablemente, alimentados adecuadamente y sus alrededores mantenidos en las mejores condiciones
sanitarias posibles” (p. 487). Esta preocupación se refleja en las modernas directrices de la APA (2003a)
que rigen la investigación con animales, que establecen como principio general lo siguiente:
Como en prácticamente cualquier empresa humana, a veces se producen abusos del trato humano
en el uso de animales en la investigación. Sin embargo, estos abusos van en contra de la práctica
estándar de los investigadores de animales. Los investigadores éticos tratan a los animales con
humanidad. Cuando se descubre un trato poco ético a los animales, los investigadores en cuestión deben
ser sancionados. No se debe concluir que debido a que ocurren abusos, se debe prohibir la investigación con
La visión típica de los activistas por los derechos de los animales (Plous, 1991) se basa en una posición
filosófica, y esta posición prohíbe el uso de animales para beneficio humano como regla general, no solo
para investigación. Debe decidir por sí mismo qué actitud tomar hacia la investigación con animales, pero
la importancia del tema requiere que considere críticamente cada lado del debate y sus implicaciones.
El siguiente principio describe las consideraciones principales para los investigadores que utilizan
animales como se especifica en el código de ética de la APA (2002). Una especificación más detallada
de estos principios se encuentra en las Pautas para la conducta ética en el cuidado y uso de animales de
la APA (2003a).
8.09 Cuidado humanitario y uso de animales en la investigación (a) (e) Los psicólogos usan un procedimiento que somete a los animales a
Los psicólogos adquieren, cuidan, usan y disponen de animales de dolor, estrés o privación solo cuando no se dispone de un procedimiento
conformidad con las leyes y reglamentos federales, estatales y locales alternativo y el objetivo está justificado por su valor científico, educativo o
vigentes, y con los estándares profesionales. aplicado prospectivo.
(b) Psicólogos capacitados en métodos de investigación y con experiencia (f) Los psicólogos realizan procedimientos quirúrgicos bajo la anestesia
en el cuidado de animales de laboratorio supervisan todos los procedimientos adecuada y siguen técnicas para evitar infecciones y minimizar el dolor
que involucran a los animales y son responsables de garantizar la durante y después de la cirugía.
consideración adecuada de su comodidad, salud y trato humanitario. (g) Cuando sea apropiado que se termine con la vida de un animal, los
(c) Los psicólogos se asegurarán de que todas las personas bajo su psicólogos procederán rápidamente, con un esfuerzo por minimizar el dolor
supervisión que utilicen animales hayan recibido instrucción en métodos de y de acuerdo con los procedimientos aceptados.1
investigación y en el cuidado, mantenimiento y manejo de las especies
utilizadas, en la medida adecuada a su función. (Consulte también la Norma
2.05, Delegación del trabajo a terceros).
1
Fuente: Asociación Americana de Psicología. (2002). Principios éticos
(d) Los psicólogos hacen esfuerzos razonables para minimizar la de los psicólogos y código de conducta, 2002. Copyright © 2002 de la
incomodidad, la infección, la enfermedad y el dolor de los sujetos animales. Asociación Americana de Psicología. Reimpreso con permiso.
ÿ FRAUDE CIENTÍFICO
Un ejemplo de engaño citado con frecuencia es el caso de Sir Cyril Burt. Era un psicólogo muy
respetado que estudió el papel de la herencia en la inteligencia. Publicó varios artículos que informan datos
recopilados sobre gemelos idénticos, algunos criados juntos, otros separados. Los datos se recopilaron en
el período de 1913 a 1932. En tres artículos, informó una correlación en las puntuaciones de CI de 0,944
para los gemelos criados juntos y de 0,771 para los gemelos criados por separado. Aunque las correlaciones
fueron idénticas para los tres artículos, cada uno informó un número apreciablemente diferente de sujetos.
Que las correlaciones permanecieran sin cambios a pesar de la adición de nuevos sujetos es extremadamente
improbable. Esta evidencia, junto con otros hechos sospechosos, llevó a algunos científicos e historiadores
a concluir que los datos de Burt no eran completamente honestos (Broad & Wade, 1982; Kohn, 1986).
Hay varios ejemplos de falsificación de datos. Un caso famoso es el del hombre de Piltdown descubierto
en Inglaterra en 1912. El hombre de Piltdown consistía en un cráneo de apariencia humanoide y una
mandíbula simiesca. Los huesos supuestamente representaban el "eslabón perdido" entre los simios y los
humanos. El hallazgo fue ampliamente aceptado, aunque no universalmente, durante 57 años hasta que los
científicos desconfiados utilizaron una variedad de métodos de datación para mostrar que la mandíbula era
de origen moderno, mientras que el cráneo era sustancialmente más antiguo.
Los científicos descubrieron que la mandíbula era idéntica a la de un orangután. Piltdown Man fue un
engaño, pero no se sabe quién ideó el engaño.
El sesgo deliberado del investigador puede ser más sutil que falsificar o incluso falsificar datos. Un
investigador puede optar por no reportar resultados que sean incompatibles con una teoría personal o
incluso con sus creencias políticas o sociales. De manera similar, un científico parcial puede diseñar
proyectos de tal manera que los resultados negativos o ideológicamente malos sean poco probables.
¿Cómo detectamos el fraude? La ciencia se corrige a sí misma. La verdad ganará. Cuando se publica
un hallazgo importante, la comunidad científica lo toma en serio y busca las implicaciones de los datos
informados. Cuando otros científicos intenten repetir el experimento fraudulento, no obtendrán los resultados
informados, y tales fallas eventualmente llevarán a los científicos a concluir que los hallazgos no fueron
reales. Por lo tanto, la repetición de experimentos es importante para detectar el fraude científico (Barber,
1976). Las repeticiones directas y específi cas se llaman replicaciones. Sin embargo, pueden pasar muchas
replicaciones fallidas y años de esfuerzo antes de que toda la comunidad científica esté de acuerdo en que
los resultados fraudulentos deben descartarse, un hecho que ilustra las graves consecuencias del fraude
científico.
Un problema relacionado es el plagio, o atribuirse el mérito de las ideas, datos o palabras de otra
persona. Aunque puede ser obvio para usted que no debe usar los datos de otra persona como propios, el
plagio puede ser mucho menos obvio en otros casos. Si está usando las palabras de otra persona, está
obligado a usar comillas con una cita apropiada. Modificar ligeramente la redacción de la escritura de otra
persona también es inapropiado, especialmente sin la cita adecuada. Para evitar el plagio en este caso,
puede escribir sin mirar directamente la fuente que está describiendo. El caso más complicado puede ser el
del plagio de ideas. Si la idea vino de otra persona, debe darle crédito a esa persona incluso si no la cita
directamente. Un problema potencial es que las personas pueden perder accidentalmente la noción de quién
generó qué ideas, especialmente porque las ideas a menudo se generan en discusiones verbales sobre la
marcha entre colegas. Una forma de evitar este problema es acordar la autoría al comienzo de un proyecto,
dependiendo del progreso del trabajo según lo asignado.
Como ya sabrá, la APA proporciona pautas éticas para la investigación psicológica. La aceptación de
la afiliación a la asociación compromete al miembro a adherirse a estos principios. Los principios
también están destinados a personas que no son miembros, incluidos los estudiantes de psicología y
otras personas que trabajan para un psicólogo.
La APA estableció un Comité de Ética que cumple una serie de propósitos.
A través de publicaciones, reuniones educativas y actividades de convenciones, el Comité de Ética
educa a los psicólogos y al público sobre cuestiones éticas relacionadas con la investigación
psicológica. El comité también investiga y adjudica quejas sobre prácticas de investigación poco éticas.
Se pueden encontrar ejemplos de estos casos en una publicación de APA (1987) titulada Casebook
on Ethical Issues. El Comité de Ética también publica un informe anual en American Psychologist. Los
Principios Éticos de la APA que describimos en este capítulo fueron aprobados en 2002 y entraron en
vigor en junio de 2003.
Una cantidad sustancial de la investigación psicológica está financiada por uno de los brazos del
Servicio de Salud Pública (PHS), que forma parte del Departamento de Salud y Servicios Humanos de
los Estados Unidos. El PHS tiene una división llamada Office of Research In tegrity, que tiene como
deber proteger la integridad de los programas de investigación del PHS. Este es un gran esfuerzo.
Cada año, el PHS proporciona varios miles de millones de dólares para apoyar más de 30 000 becas
de investigación en varias disciplinas, incluida la psicología. La Oficina de Integridad de la Investigación
y la APA se combinan para considerar la prevención del fraude y la protección de los participantes.
Además, cualquier institución que reciba dinero del gobierno federal, lo que significa prácticamente
todas las instituciones estadounidenses que se dedican a la investigación,
debe tener una junta de revisión institucional (IRB) que supervise la protección de los participantes
humanos y un comité institucional de cuidado y uso de animales (IACUC) que supervise la
protección de los sujetos animales. Un investigador envía un protocolo detallado al IRB (o IACUC).
Presuntamente, el protocolo trata de tener en cuenta los principios éticos pertinentes, y los miembros
del comité luego juzgan la ética del proyecto.
Todos los experimentos deben ser aprobados por los miembros de estos comités. Las reglamentaciones
federales requieren que cada IRB tenga al menos cinco miembros que estén calificados para revisar
el tipo de investigación que normalmente se lleva a cabo dentro de la institución. Además, si un IRB
ÿ RESUMEN
1. Un investigador ético protege el bienestar de los 3. El participante tiene derecho a negarse a participar en un
participantes en la investigación siguiendo las normas experimento oa retirarse de un experimento en cualquier
éticas de la APA. momento.
2. Informar al participante sobre el experimento antes de la 4. En una investigación ética, el participante está protegido
participación y un uso mínimo del engaño por parte del contra daños físicos y mentales.
investigador permite que el participante haga un juicio 5. Después de recopilar los datos, se debe informar
razonado sobre si participar. cuidadosamente a los participantes para eliminar
cualquier concepto erróneo que pueda haber surgido.
ÿ TÉRMINOS CLAVE
ÿ PREGUNTAS DE DISCUSIÓN
1. Reconsidere los principios éticos presentados en este capítulo principios éticos involucrados en el caso. Describa por qué
y lea la lista de principios éticos presentada por la APA está de acuerdo o en desacuerdo con la decisión del Comité
(1987, 2002). de Ética.
2. Lea selecciones del Libro de casos sobre ética 3. Lea dos de los artículos enumerados en la siguiente sección
Números publicados por la APA (1987), que probablemente de Lecturas sugeridas. Estos artículos describen las
esté disponible en su biblioteca. Este libro describe los cuestiones éticas asociadas con diferentes tipos de
antecedentes de diferentes denuncias éticas, cómo se investigación psicológica. Considere los principios éticos
enviaron las denuncias al Comité de Ética y cómo se generales que se aplican en ambos casos. Describa cómo
adjudicaron los casos. Seleccione dos casos y considere el difieren las cuestiones éticas entre los dos tipos de
investigación discutidos en los artículos.
CONEXIONES WEB
Además del tratamiento de la ética por parte de la APA en http://www.apa.org, hay un buen sitio que
contiene dilemas éticos y ejercicios relacionados con esos dilemas:
http://onlineethics.org/reseth/psychindex.html
Otro buen sitio relacionado con el fraude, los valores y otras cuestiones éticas, incluida la investigación
responsable, se puede encontrar en:
http://www.nap.edu/readingroom/books/obas/
Hoff, C. (1980). Usos inmorales y morales de los animales. Revista de Medicina de Nueva Inglaterra,
302, 115–118.
Imber, SD, Glanz, LM, Elkin, I., Sotsky, SM, Boyer, JL y Leber, WR (1986).
Cuestiones éticas en la investigación en psicoterapia: problemas en un estudio clínico colaborativo.
Psicólogo estadounidense, 41, 137–146.
Melton, G. y Gray, J. (1988). Dilemas éticos en la investigación del SIDA: privacidad individual y salud
pública. Psicólogo estadounidense, 43, 60–64.
Milgram, S. (1977). Cuestiones éticas en el estudio de la obediencia. En S. Milgram (Ed.), El individuo en
un mundo social (págs. 188–199). Reading, MA: Addison-Wesley.
Miller, NE (1985). El valor de la investigación del comportamiento en animales. Psicólogo estadounidense,
40, 423–440.
Cicatriz, S. (1988). Raza y género como variables psicológicas: Cuestiones sociales y éticas.
Psicólogo estadounidense, 43, 56–59.
Sieber, JE y Stanley, B. (1988). Dimensiones éticas y profesionales de la investigación socialmente
sensible. Psicólogo estadounidense, 43, 49–55.
Smith, CP (1983). Cuestiones éticas: investigación sobre engaño, consentimiento informado y debriefing.
En L. Wheeler & P. Shaver (Eds.), Revisión de la personalidad y la psicología social
(Vol. 4, págs. 297–328). Beverly Hills, CA: Sabio.
PSICOLOGÍA EN ACCIÓN
Entender y recordar
Formularios de consentimiento
Según la APA (2002), los experimentos psicológicos requieren el consentimiento informado del sujeto
antes de su participación. Sin embargo, ¿cuán significativa es la firma de un sujeto en un formulario de
consentimiento si él o ella no entendió y no recuerda la información del formulario de consentimiento?
Mann (1994) hizo que las personas leyeran un formulario de consentimiento o una hoja de
información sobre un experimento hipotético de escaneo cerebral con imágenes de resonancia magnética
funcional (IRMf). La hoja de información era igual que el formulario de consentimiento, excepto que no
requería una firma. Luego, los sujetos respondieron preguntas sobre el presunto próximo
ÿ ¿Qué tipo de dispositivo usaremos para estudiar tu cerebro? (38 por ciento correcto)
ÿ ¿Cómo funciona este dispositivo? (47 por ciento)
ÿ ¿Existen riesgos en este procedimiento? (48 por ciento)
ÿ ¿Qué puedes hacer si te molesta el sonido de la máquina? (45 por ciento)
ÿ ¿Qué puede hacer si tiene una queja sobre el estudio? (39 por ciento)
ÿ ¿Qué harán los investigadores por usted si se lastima? (47 por ciento)
ÿ Nombre dos de las cuatro cosas que significa su firma en el formulario de consentimiento. (20 por ciento)
Además, el 62 por ciento de los sujetos que firmaron el formulario de consentimiento pensaron que
habían perdido su derecho a demandar al experimentador, en comparación con solo el 16 por ciento
de los que simplemente leyeron la hoja de información.
Si está planeando un estudio propio, habrá creado un formulario de consentimiento que puede
usar en esta demostración. Si no, pídele uno a tu maestro. Diseñe una serie de preguntas que
evaluarán la comprensión y la memoria de las personas para el formulario de consentimiento.
Pida a sus amigos que lean el formulario de consentimiento y luego pídales que respondan (de
memoria) sus preguntas. ¿Cuánto recuerdan tus amigos de lo que acaban de leer?
¿Conocen los riesgos y beneficios asociados con el estudio? Si no, ¿realmente han dado su
consentimiento informado a pesar de haber firmado los formularios? ÿ
CAPÍTULO 5
CÓMO LEER
Y ESCRIBE
INVESTIGAR
INFORMES
CÓMO HACER UNA BÚSQUEDA LITERATURA
LAS PARTES DE UN ARTÍCULO
Título y Autor(es)
Resumen
Introducción
Método
Resultados
Discusión
Referencias
Discusión
Manuscrito de muestra
Estilo
Publicar un artículo
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
RECURSO DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: UNA BÚSQUEDA LITERATURA
99
Tratar de leer un artículo de una revista de psicología por primera vez puede ser una experiencia
desafiante. Los investigadores escriben artículos para otros investigadores, por lo que utilizan la jerga
y un estilo de escritura conciso. Estas características ayudan a la comunicación entre los académicos
de un campo en particular, quienes pueden leer informes breves y comprenderlos. Pero tal escritura
puede ser difícil de comprender para los estudiantes que comienzan a estudiar un campo. Este
capítulo está diseñado para prepararlo para su primer encuentro con la literatura de la psicología experime
Debido a que la psicología es una ciencia, el progreso se mide por la acumulación de conocimientos
en los diversos campos. Los investigadores pasan gran parte de su tiempo leyendo y escribiendo
artículos de revistas en un esfuerzo por contribuir a este cuerpo de conocimiento. Incluso si su carrera
en psicología no se extiende más allá de este curso, descubrirá que el pensamiento crítico y las
habilidades de escritura son invaluables para vivir en un mundo que gira en torno a la información.
Para ayudarlo a adquirir fluidez en el arte de leer y escribir informes de investigación, en este capítulo
describimos el formato y el estilo que se usan con más frecuencia en los artículos de revistas. Se
proporcionan sugerencias para ayudarlo a convertirse en un lector crítico, hábil para evaluar
objetivamente un artículo. Con un poco de práctica, superará con creces a la Falsa Tortuga y no
tendrá que "bambolear y retorcerse" en cada artículo de psicología que lea. El capítulo termina con
algunas recomendaciones para escribir un informe de investigación.
Una vez que se le ha ocurrido una idea de investigación, el siguiente paso suele ser realizar una
búsqueda bibliográfica. El propósito de una búsqueda bibliográfica es averiguar lo que otros
investigadores han descubierto previamente sobre un tema en particular. Esto se hace rastreando
artículos publicados en los que los investigadores han informado sobre sus hallazgos científicos.
La forma más fácil de realizar una búsqueda bibliográfica es por computadora. Muchas
bibliotecas le permiten acceder a bases de datos electrónicas que contienen resúmenes de artículos
de revistas que publican investigaciones psicológicas. Se hablará más sobre los resúmenes más
adelante en este capítulo, pero por lo general son resúmenes breves (180 palabras o menos) de los
experimentos del artículo. Una de las bases de datos electrónicas más importantes es PsycINFO,
que actualmente contiene más de 2 millones de registros. Con una base de datos electrónica,
proporciona un tema y la computadora busca resúmenes relacionados con ese tema. Algunas bases
de datos también le permiten buscar documentos gubernamentales e informes técnicos que a menudo
no tienen resúmenes. Otra forma popular de realizar una búsqueda bibliográfica computarizada es
utilizar el motor de búsqueda de Internet Google Scholar (http://scholar.google.com/), que analiza la
literatura académica en muchas disciplinas, incluida la psicología. (Consulte la sección Psicología en
acción al final de este capítulo para ver un ejemplo de cómo realizar una búsqueda electrónica).
Un excelente recurso electrónico para conocer los últimos hallazgos de investigación es el Social
Science Citation Index. Al ingresar información sobre un artículo clave que usted
El artículo de psicología básica consta de siete partes: título y autor(es), resumen, introducción,
método, resultados, discusión y referencias. Cada parte tiene una función importante y es un
componente necesario del artículo.
Título y Autor(es)
El título le da una idea del contenido de un artículo. Debido a que los títulos deben ser breves (de
10 a 12 palabras), el tipo de título más común establece solo las variables dependientes e
independientes, por ejemplo, "Tasa de presión de la barra en función de la calidad y cantidad de la
recompensa de comida". Aunque este título no es particularmente atractivo, transmite información
importante. El título y el(los) autor(es) de cada artículo suelen ocupar un lugar destacado en un
número determinado de la revista, como el interior de la portada, la contraportada o la primera página
A medida que continúe adquiriendo conocimientos en un área de contenido en particular, se
familiarizará con muchos investigadores. Puede comenzar a prestar atención a los autores primero
y luego mirar los títulos. Después de haber leído varios artículos publicados por el mismo autor,
comprenderá los puntos de vista de ese escritor y en qué se diferencian de los de otros
investigadores.
Cada mes se publican tantos artículos de psicología que nadie tiene tiempo para leerlos
todos. La tabla de contenido es un primer paso para seleccionar aquellos artículos relevantes para
sus propios intereses. Pero se puede tomar una decisión aún mejor consultando el resumen y las
referencias de un artículo.
Resumen
El resumen es un párrafo breve (que no debe exceder las 180 palabras) que resume los puntos
clave de un artículo. Según el Manual de publicación de la Asociación Americana de Psicología
(APA, 2001), debería ser “. . . un resumen breve y completo del contenido del artículo; permite a
los lectores examinar rápidamente el contenido de un artículo” (p. 12). El resumen es la mejor
manera de descubrir rápidamente de qué trata un artículo. Un resumen de revista bien escrito
transmitirá el problema que se investiga, el procedimiento utilizado para explorar el problema, los
resultados, las conclusiones y las implicaciones o aplicaciones de los hallazgos de la investigación.
Esta información proporcionada en breve le permite
Introducción
La introducción especifica el problema a estudiar y explica por qué es importante. El autor también
revisa la literatura de investigación relevante sobre el tema. Una buena introducción también
especifica las hipótesis que se probarán y da la razón detrás de las predicciones.
Método
La sección del método describe en detalle las operaciones realizadas por el experimentador.
Por lo general, se imprime en letra más pequeña para ahorrar espacio, pero esto no significa que
no sea una parte importante del artículo que se deba hojear rápidamente. La sección del método
debe contener suficiente información para que otro experimentador pueda replicar el estudio.
Se acostumbra dividir la sección de método en subsecciones que cubren a los participantes
(o sujetos), aparatos o materiales y procedimiento. los participantes
La sección (o sujetos) dice cuántos sujetos había, cómo fueron seleccionados (al azar, al azar, solo
los familiares del investigador, etc.) y quiénes eran (estudiantes universitarios que toman psicología
introductoria, voluntarios pagados obtenidos por un anuncio en un periódico, una cepa particular de
ratas compradas en una casa de suministros).
La sección de aparatos describe cualquier equipo utilizado para evaluar a los sujetos. Esta sección
puede incluir detalles como el número de modelo de una computadora o el tamaño de una cámara
de acondicionamiento. Esta sección se denomina sección de materiales cuando se utilizan
cuestionarios, bocetos escritos o grabados en video y otros medios similares para evaluar a los
sujetos. Si son largos, se pueden colocar materiales especiales en una sección de apéndice,
generalmente en letra más pequeña. La sección de procedimiento explica lo que les sucedió a los
sujetos e incluye instrucciones (para sujetos humanos), características de diseño estadístico, etc. Si
se utilizó una técnica estadística poco común, es decir, una que no se puede buscar directamente
en un texto de estadísticas avanzadas y citar, un diseño adicional
a menudo se incluye una subsección. A veces, incluso una técnica estadística estándar se describe
en una subsección de diseño.
Resultados
La sección de resultados cuenta lo que sucedió en el experimento. Es inusual encontrar datos sin
procesar o puntajes individuales informados en un artículo de revista; en cambio, se presentan
estadísticas descriptivas que resumen los datos. Las estadísticas inferenciales presentan la
probabilidad de que las diferencias observadas entre las diversas condiciones experimentales hayan
sido producidas por factores aleatorios o fortuitos. Esta información ayuda tanto al investigador
como al lector a determinar qué tan seguro debe estar de que la(s) variable(s) independiente(s)
produjo(n) un cambio en la variable dependiente. (Consulte el Apéndice B para una explicación y
revisión más detalladas). Ambos tipos de estadísticas son importantes y ayudan a los psicólogos a
comprender el resultado de un experimento.
7 Nosotros
Escalas exageradas. Exactamente
los mismos datos se presentan en
los dos paneles de la Figura 5.1, 6
pero la escala en el panel (a) está
en segundos y la del panel (b) está
en milisegundos (con un corte de 5
grandes en (b).
3
0
Palabras no-palabras
(b)
760
720
680
640
(milisegundos)
reacción
Tiempo
de
600
560
520
Palabras no-palabras
demasiado alto, porque la importación es muy grande. Un nivel de significación de 1 en 1000 sería más
apropiado.
O tomemos el caso de una compañía de cereales para el desayuno que desea incluir un “premio”
dentro de la caja. Realiza un análisis estadístico para decidir cuál de los cinco premios potenciales, todos
los cuales cuestan lo mismo, es el preferido por los consumidores. Si hay alguna diferencia entre los
premios, la empresa quiere asegurarse de encontrar el mejor. Si la empresa se equivoca y selecciona
incorrectamente uno, cuando en realidad todos son igualmente atractivos, no se hace mayor daño, ya que
cada premio cuesta lo mismo. Aquí, las probabilidades de 5 en 100 son demasiado bajas. Un nivel de significaci
Discusión
La discusión es la parte más creativa de un artículo. Aquí, un autor puede reafirmar lo que muestran
los datos (si así lo desea) y sacar conclusiones teóricas.
La mayoría de los editores tienen estándares firmes para las secciones de métodos y resultados, pero
al autor se le da mayor libertad en la discusión. En palabras del Manual de publicación de la Asociación
Americana de Psicología (APA, 2001): “Eres libre de examinar, interpretar y calificar los resultados,
así como de sacar inferencias de ellos” (p. 26). Tenga en cuenta que los resultados de la investigación
no son verdades indiscutibles y que los hallazgos experimentales son relativos al contexto en el que
se encuentran. La libertad del autor requiere prudencia por parte de los lectores.
Referencias
Las referencias se encuentran al final del artículo. A diferencia de las revistas de otras disciplinas,
las revistas de psicología enumeran los títulos completos de los artículos a los que se hace referencia.
Esta práctica ayuda a decirle al lector de qué trata el artículo. Además, las referencias son valiosas
como guía para obtener información relacionada. También se pueden utilizar como índice del mérito
del artículo. Los artículos deben hacer referencia a los trabajos publicados más recientemente en el
área, así como a las publicaciones anteriores más importantes.
Además, solo los artículos citados en el texto deben incluirse en la sección de referencia.
Esto es diferente de una bibliografía, que incluye tantas citas relevantes como sea posible.
En esta sección, ofrecemos algunos consejos que nos han ayudado a convertirnos en mejores
consumidores de la información presentada en las revistas psicológicas. Nuestra sugerencia principal
es evitar apresurarse a leer un artículo. En su lugar, puede detenerse deliberadamente después de
cada sección y escribir las respuestas a las preguntas que enumeraremos aquí. Esto puede ser difícil
al principio, pero con la práctica, este proceso se vuelve automático y requiere poco tiempo extra.
Método
Compare su respuesta a la Pregunta 3 con la del autor del artículo. Probablemente diferirán, si no
los has mirado. Ahora responda las preguntas 4(a–c).
4(a). ¿Es mi método propuesto mejor que el del autor? Independientemente de quién tenga
el mejor método, tú o el autor, esta comparación forzada te hará pensar críticamente en la
sección del método, en lugar de aceptarla pasivamente.
4(b). ¿El método del autor realmente prueba la hipótesis? La hipótesis es a veces la
primera víctima, desapareciendo entre las secciones de introducción y método. Verifique
siempre que el método utilizado sea adecuado y relevante para la hipótesis en cuestión.
4(c). ¿Cuáles son las variables independientes, dependientes y de control? Esta es una
pregunta obvia y se puede responder rápidamente. Enumerar las variables le ayuda a
evitar la lectura pasiva de la sección de métodos. Una vez que haya resuelto las diferencias
entre su método propuesto y el del autor, responda la siguiente pregunta.
5. Utilizando los sujetos, aparatos o materiales y procedimientos descritos por el autor,
¿qué resultados puedo predecir para este experimento? Debe responder esto por su
cuenta antes de leer la sección de resultados. Para ayudarte, revisa las hipótesis y las
variables independientes y dependientes. Puede que le resulte imposible predecir un solo
resultado. Esto no es realmente un problema, ya que el autor probablemente también tenía
originalmente más de una predicción. Es posible que haya realizado algunas investigaciones
preliminares para reducir los posibles resultados; alternativamente, él o ella puede haber sido
Resultados
Compare los resultados con sus predicciones. Si son iguales, pase a las Preguntas 7(a), 7(b) y 7(c). Si no, responda
la pregunta 6.
6. ¿Obtuvo el autor resultados inesperados? Después de pensar un poco, llegará a una de dos
conclusiones: o su predicción fue incorrecta o los resultados son difíciles de creer.
Tal vez el método que seleccionó el autor fue inapropiado y no probó adecuadamente las hipótesis establecidas o
introdujo fuentes de varianza no controlada. O tal vez estos resultados no se volverían a obtener si se repitiera el
experimento. Incluso podría intentar su propio experimento. Vea si puede replicar los resultados informados.
7(c). ¿Se me ocurre otra explicación para estos resultados? Incluso cuando los datos son los
previstos, puede haber más de una razón por la que los resultados se produjeron como se produjero
A menudo encontrará artículos de experimentos múltiples en los que los autores hacen un seguimiento de su primer
experimento haciendo experimentos adicionales para eliminar explicaciones alternativas.
Es posible que desee intentar pensar en un nuevo experimento para probar una hipótesis alternativa.
Discusión
Como se mencionó anteriormente, la sección de discusión incluye la interpretación del autor de los datos en forma
de conclusiones. Una buena sección de discusión completa el círculo del lector, ya que brinda una respuesta
narrativa a la pregunta planteada en la introducción. Además, el autor amplía sus conclusiones al ofrecer información
sobre las aplicaciones e implicaciones de los resultados experimentales.
8(a). ¿Mi interpretación o la del autor representan mejor los datos? Debido a que los autores
tienen más libertad en la sección de discusión que en otras secciones de un informe, es posible
encontrar que un autor ha sacado conclusiones que pueden no estar justificadas por los datos. En
otros casos, los autores extraen conclusiones que son en gran medida apropiadas y luego
proceden a ampliar estas conclusiones más allá de lo que los datos pueden respaldar. La última
situación suele ocurrir cuando un investigador no reconoce las limitaciones de la variable
dependiente.
8(b). ¿Ofrezco yo o el autor la discusión más convincente de las aplicaciones e implicaciones de
los resultados? Esta pregunta es secundaria a la pregunta planteada en 8(a).
No obstante, puede obtener información valiosa sobre la integridad general de la investigación.
Mientras lee atentamente su primer artículo, trate de escribir las respuestas a las ocho
preguntas. Es un trabajo duro las primeras veces, así que no te desanimes. En la siguiente
sección, analizamos un artículo psicológico típico de acuerdo con la lista de verificación
resumida en la Tabla 5.1.
ÿ TABLA 5.1
Introducción
Método
Resultados
Discusión
En esta sección, hemos reimpreso un breve artículo de Psychological Science, con ejemplos de
respuestas a las preguntas de la lista de verificación.1 El artículo trata sobre el efecto de imaginarse
a uno mismo votando en el comportamiento electoral real posterior.
La mayoría de los artículos están escritos para expertos en un área en particular, por lo que los
autores de un informe asumen que sus lectores tienen algún conocimiento del tema que se investiga.
Además, la mayoría de las revistas establecen límites de páginas para los artículos, lo que significa
que puede faltar cierta información o presentarse de manera muy breve. Las suposiciones hechas
por los autores y la brevedad de muchos artículos plantean un problema para el lector novato. Es
posible que el novato tenga que leer otros artículos o libros de texto para comprender un informe en
particular. El siguiente informe fue elegido para ser bastante fácil de entender; sin embargo, puede
encontrar partes confusas. No te desanimes. Para ayudarlo, hemos colocado elementos de la lista de
verificación en varios lugares estratégicos a lo largo del artículo.
1. ¿Cuáles son los objetivos de los autores? Los autores buscan probar si la probabilidad de votar en
una elección presidencial depende de la perspectiva visual, en primera o tercera persona, desde la cual
las personas se imaginan votando. Investigaciones anteriores han examinado cómo la perspectiva
visual afecta una variedad de otros fenómenos psicológicos (p. ej., cómo las personas explican su
propio comportamiento pasado), pero los autores querían ser los primeros en estudiar si afecta la
probabilidad de seguir adelante con el comportamiento futuro.
2. ¿Qué hipótesis se probarán en el experimento? Los autores tienen la intención de probar dos
hipótesis relacionadas, las cuales están claramente establecidas en el párrafo final de la introducción.
Una hipótesis es que imaginarse votando desde la perspectiva de la tercera persona hace que las
personas se atribuyan más sentimientos favorables al voto. Es decir, si las personas se “ven” a sí
mismas votando en su imaginación mental, llegan a creer que personalmente tienen pensamientos y
sentimientos más positivos acerca de votar. La segunda hipótesis es que imaginarse votando desde la
perspectiva de la tercera persona hace que sea más probable que las personas voten.
3. Si tuviera que diseñar un experimento para probar estas hipótesis, ¿qué haría? Idealmente, debe
tratar de responder a esta pregunta antes de leer sobre el método de los autores para probar las hipótesis.
Sin embargo, en este documento, los autores han resumido brevemente su método en las últimas tres
oraciones de la introducción. De hecho, no es inusual que los autores proporcionen una descripción general
de su método en la introducción antes de presentar los detalles en la sección del método en sí. Esta práctica
ayuda al lector a obtener el “panorama general” antes de obtener todos los detalles. Sin embargo, vale la
pena pensar en cómo diseñaría un experimento propio para probar las hipótesis antes de sumergirse en la
sección del método. En este caso, es obvio que, en cualquier experimento que pueda diseñar, necesitaría
asignar a algunos sujetos a una condición en la que se imaginaran votando desde la perspectiva de primera
persona y a otros sujetos a una condición en la que hicieran lo mismo. Lo mismo desde la perspectiva de la
tercera persona. Una posibilidad sería llevar estudiantes universitarios a un laboratorio de psicología antes
de una elección del gobierno estudiantil y asignarles a la mitad que se imaginen votando en la elección
desde la perspectiva de primera persona y la otra mitad desde la perspectiva de tercera persona.
Luego, puede enviar un correo electrónico a los estudiantes después de la elección y determinar cuántos de
ellos en la condición de tercera persona votaron versus cuántos en la condición de primera persona.
Una pregunta más difícil es cómo determinar si los estudiantes en la condición de tercera persona se
atribuyeron más sentimientos de pro-voto que los estudiantes en la condición de primera persona. ¿Cómo
mediría los pensamientos y sentimientos de los estudiantes acerca de votar? Una posibilidad sería pedirles
a los estudiantes que califiquen su actitud hacia la votación en una escala que va de “muy negativa” a “muy
positiva”.
Método
Sujetos Doscientos cincuenta y seis estudiantes universitarios (163 mujeres) de la Universidad
Estatal de Ohio completaron el cuestionario preelectoral en línea para recibir créditos del curso.
Sujetos que ya habían votado (n = 95), que no estaban registrados para votar (n = 1), que no
indicaron si estaban registrados (n = 1), o que no indicaron si ya habían votado (n = 6) fueron
excluidos de los análisis. Siete sujetos (4 en la condición de tercera persona) fueron excluidos por
fallar el control de manipulación (descrito más adelante).
Materiales y Procedimiento
Los sujetos preelectorales fueron reclutados para un estudio en línea de la imaginación. Si bien se
especificó que los sujetos deben ser votantes registrados para participar, no se mencionó ninguna otra
conexión con la votación o la elección en el reclutamiento. A las 6:30 pm del 1 de noviembre de 2004, los
sujetos recibieron un correo electrónico con un enlace a una de las dos versiones del cuestionario. Los sujetos
fueron asignados aleatoriamente a estas versiones, que diferían solo en las instrucciones para la perspectiva
de las imágenes a tomar. Los sujetos completaron el cuestionario en sus propias computadoras en cualquier
momento hasta que se abrieron las urnas el 2 de noviembre de 2004 a las 6:30 a. m.
Después de proporcionar información demográfica, los sujetos leyeron que se les pediría que se
imaginaran a sí mismos participando en una acción particular en el futuro y que deberían seguir las
instrucciones sobre cómo visualizar la imagen. Recibieron instrucciones de visualización en primera o tercera
persona (redacción en tercera persona entre paréntesis):
Debes imaginarte haciendo la acción desde una perspectiva visual en primera persona [tercera persona].
Con la perspectiva visual en primera persona [tercera persona], usted ve el evento desde la perspectiva
visual que tendría [un observador] si el evento realmente estuviera ocurriendo. Es decir, estás mirando tu
entorno a través de tus propios ojos [te ves a ti mismo en la imagen, así como a tu entorno].
Luego se instruyó a los sujetos para que cerraran los ojos y usaran la perspectiva especificada para imaginarse
a sí mismos “votando en las próximas elecciones presidenciales”. Cuando tuvieran la imagen en mente,
debían sostenerla allí y responder "sí" o "no" a la siguiente pregunta, que variaba según la condición y servía
como control de manipulación (redacción en tercera persona entre paréntesis):
Mientras lo imagina ahora, ¿se ve [a sí mismo en] la escena desde la perspectiva visual que tendría [un
observador] si el evento realmente estuviera ocurriendo?
Finalmente, los sujetos utilizaron escalas de 7 puntos que iban desde nada (1) hasta extremadamente
(7) para indicar hasta qué punto se sentían emocionados, asustados, aburridos, felices, nerviosos,
determinados, inspirados, tristes, desmotivados y esperanzados. .
La página final del cuestionario agradeció a los sujetos por su tiempo y presentó
enlaces a información sobre los derechos de los votantes, el registro de votantes y los lugares de votación.
Postelectoral El 22 de noviembre de 2004, todos los sujetos recibieron un correo electrónico invitándolos
a responder una encuesta en línea dentro de los siguientes 4 días. El cuestionario comenzaba con el
siguiente ítem, inspirado en los utilizados para evaluar el comportamiento electoral en la Encuesta de
Población Actual de la Oficina del Censo de EE. UU. y en los Estudios Electorales Nacionales Estadounidense
Al hablar con la gente sobre las elecciones, a menudo encontramos que muchas personas no
pudieron votar porque no estaban registradas, estaban enfermas o simplemente no tenían tiempo.
¿Y usted, votó en las elecciones presidenciales más recientes?
4a. ¿Es mi método propuesto mejor que el de los autores? El método de los autores tiene tres ventajas
principales sobre el que propusimos. Primero, al hacer que los estudiantes completen el cuestionario preelectoral
(incluida la tarea de visualización) en línea, los autores se ahorraron la molestia de tener que llevar a los
estudiantes al laboratorio como sugerimos. No podemos decirlo con certeza, pero al realizar el experimento en
línea, los autores pueden haber podido recopilar datos de más sujetos que si hubieran realizado los sujetos en
el laboratorio, porque no tenían que encontrar el tiempo para reunirse con los sujetos en el laboratorio. persona
y porque los estudiantes que deseaban participar podían hacerlo a su conveniencia.
En segundo lugar, los autores estudiaron la votación en una elección presidencial, a diferencia
de una elección de gobierno estudiantil, y esto, naturalmente, parece más importante. Si la perspectiva
visual afecta la votación en una elección presidencial, el hallazgo probablemente será más interesante
para la gente que si afecta la votación en una elección del gobierno estudiantil.
En tercer lugar, los autores hicieron una variedad de preguntas para medir la actitud de los sujetos
sobre el voto, en lugar de solo una como propusimos. Pidieron a los sujetos que calificaran en general
qué tan bueno o malo fue votar en las elecciones, lo cual es similar a nuestra calificación propuesta,
pero también pidieron varias otras calificaciones, como qué tan importante personalmente fue votar,
qué tan satisfechos estarían. sienten si votaron y su candidato ganó, y cuán probable sería que votaran
incluso si tuvieran problemas el día de las elecciones. Como veremos, los autores combinaron las
respuestas de los sujetos a todas estas preguntas en una sola medida de los sentimientos a favor del
voto. Debido a que esta medida evalúa los pensamientos de los sujetos
1El uso de encuestas autoadministradas (por ejemplo, cuestionarios de Internet) en lugar de entrevistadores humanos significa:
reduce considerablemente las presiones de deseabilidad social en los autoinformes conductuales (votación: Holbrook y
Krosnick, 2006; otros comportamientos: Tourangeau y Smith, 1996).
5. Utilizando los sujetos, aparatos o materiales y procedimientos descritos por los autores, ¿qué resultados
pronosticaría para este experimento? Antes de leer este artículo, probablemente nunca consideró si la
perspectiva visual en las imágenes mentales afecta las actitudes de las personas sobre la actividad imaginada
o si afecta la probabilidad de que las personas realmente participen en la actividad. ¡Es posible que nunca
hayas pensado en la diferencia entre la perspectiva en tercera y primera persona! A pesar de lo que han
argumentado los autores, es posible que no crea que algo tan aparentemente trivial como la perspectiva visual
pueda afectar algo tan importante como la votación, por lo que puede resultarle difícil predecir que la perspectiva
en tercera persona en realidad provocará que más personas voten. hace la perspectiva en primera persona. Si
continúa leyendo artículos en el campo de la psicología, probablemente esta no sea la última vez que se
encuentre con una predicción difícil de creer. La investigación psicológica a menudo produce resultados que
pocas personas podrían predecir de antemano.
Resultados
Sobre la base del hallazgo de que imaginar las propias acciones desde la perspectiva de la tercera
persona conduce a una interpretación más disposicional del comportamiento visualizado que imaginar las
propias acciones desde la perspectiva de la primera persona, predijimos que los sujetos que imaginaban
votar desde la tercera persona La perspectiva personal adoptaría una mentalidad más fuerte correspondiente
al comportamiento electoral y, por lo tanto, sería más probable que votaran en las elecciones que los
sujetos que imaginaron votar desde la perspectiva de la primera persona.
Mentalidad de pro-votación Para evaluar el efecto de la perspectiva en las autopercepciones de los
sujetos como votantes, creamos un índice compuesto de pro-votación al estandarizar y promediar las
respuestas sobre las principales medidas dependientes previas a las elecciones (actitud, importancia,
probabilidad, impacto del voto). , arrepentimiento, satisfacción y respuestas a los tres escenarios del problema =
Como se predijo, imaginar la votación desde la perspectiva de la tercera persona hizo que los sujetos
adoptaran una mentalidad de pro-votación más fuerte (M = .10, SD = .58) que imaginar la votación desde
la perspectiva de la primera persona (M = ÿ.11). , DE = .69), t(144) = 2.07, p < .05, = .93, d = 0.33.
reps p
.25* .67*
.33*
Imágenes Votación
Perspectiva Comportamiento
(.13ns)
Fig. 1 Análisis de mediación que relaciona la perspectiva de las imágenes y la mentalidad de promoción
con el comportamiento electoral, Sobel z = 1.85,reps
p <de.07,
regresión
p = .90.estandarizados.
Los números enLalasperspectiva
rutas son coeficientes
de las
imágenes se codificó ÿ1 para primera persona y +1 para tercera persona. El comportamiento de voto se
codificó 0 para no votar y 1 para votar. Los asteriscos indican coeficientes significativamente diferentes de
cero, *p < .05, Prep > .93. El número entre paréntesis es el coeficiente de regresión estandarizado para la
perspectiva de las imágenes cuando se incluyó en la ecuación la mentalidad a favor del voto.
6. ¿Los autores obtuvieron resultados inesperados? Los autores encontraron, como predijeron, que la
perspectiva en tercera persona hizo que los sujetos tuvieran una mentalidad más fuerte a favor del voto y que
fueran más propensos a votar. Estos resultados no fueron inesperados para los autores, pero pueden ser
sorprendentes para usted.
Otro resultado importante se menciona en una sola oración bajo el título Comportamiento electoral,
pero se ilustra en la Figura 1. Un procedimiento estadístico conocido como análisis de mediación mostró
que la mentalidad favorable al voto “mediaba” el efecto de la perspectiva en el comportamiento electoral.
Lo que esto significa es que la perspectiva en tercera persona no provocó directamente que los sujetos
tuvieran más probabilidades de votar. Más bien, la perspectiva hizo que las personas tuvieran una
mentalidad más fuerte a favor del voto, y esta mentalidad hizo que las personas fueran más propensas
a votar. En otras palabras, el análisis estableció una cadena causal que vincula la perspectiva de la
tercera persona con la mentalidad favorable al voto y la mentalidad favorable al voto con la votación.
7a. ¿Cómo interpretaría estos resultados? Los resultados son sencillos y la interpretación es clara: imaginarse
votando desde la perspectiva de la tercera persona frente a la perspectiva de la primera persona puede hacer
que las personas sientan que votar es más importante personalmente para ellas y este sentimiento puede
llevar a las personas a votar.
7b. ¿Qué aplicaciones e implicaciones sacaría de mi interpretación de los resultados? Una implicación
importante de estos resultados es que puede ser posible aumentar la participación electoral alentando a los
votantes potenciales a imaginarse votando desde la perspectiva de una tercera persona. Por ejemplo, tal vez
los organizadores de mítines políticos deberían guiar a la multitud en una breve tarea de visualización en
tercera persona como la que realizaron los sujetos de este experimento.
7c. ¿Se me ocurre otra explicación para estos resultados? Dada la simplicidad del método de los
autores y la claridad de sus resultados, es difícil pensar en una explicación alternativa que no sea que
la perspectiva en tercera persona aumentó los sentimientos a favor del voto y estos sentimientos
llevaron a la gente a votar. Sin embargo, si puede pensar en otra explicación, también debe pensar en
cómo diseñaría un experimento para probar su explicación.
Discusión
El simple hecho de variar la perspectiva visual que los individuos usaban para imaginarse a sí mismos
participando en un comportamiento futuro deseable afectó sus autopercepciones y su probabilidad de lograrlo
Expresiones de gratitud
Este artículo está dedicado a la memoria de Jon Slemmer, cuya experiencia fue fundamental para llevar a
cabo esta investigación.
Referencias
Baldwin, MW y Holmes, JG (1987). Audiencias privadas destacadas y conciencia de sí mismo.
Revista de personalidad y psicología social, 52, 1087–1098.
Barresi, J. y Moore, C. (1996). Relaciones intencionales y comprensión social. Comportamiento y
Ciencia del cerebro, 19, 107–154.
Bartlett, FC (1932). Recordando: un estudio en psicología experimental y social. Nueva York:
Prensa de la Universidad de Cambridge.
Batson, CD, Early, S. y Salvarani, G. (1997). Toma de perspectiva: imaginar cómo se siente otro versus imaginar
cómo te sentirías tú. Boletín de Personalidad y Psicología Social, 23, 751–758.
Conway, MA, Meares, K. y Standart, S. (2004). Imágenes y goles. Memoria, 12, 525–531.
Dao, J. (2004, 1 de noviembre). Para llevar a los votantes de Ohio a las urnas, los voluntarios tocan, hablan y engatusan.
The New York Times, pág. 17A.
D'Argembeau, A. y Van der Linden, M. (2004). Características fenomenales asociadas con la proyección de uno mismo
hacia el pasado y hacia el futuro: Infl uencia de la valencia y la distancia temporal. Conciencia y cognición: una
revista internacional, 13, 844–858.
Decety, J. y Grezes, J. (2006). El poder de la simulación: Imaginar el comportamiento propio y ajeno. Investigación del
cerebro, 1079, 4–14.
Frank, MG y Gilovich, T. (1989). Efecto de la perspectiva de la memoria sobre las atribuciones causales retrospectivas.
Revista de Personalidad y Psicología Social, 57, 399–403.
Gregory, WL, Cialdini, RB y Carpenter, KM (1982). Escenarios auto-relevantes como mediadores de estimaciones de
probabilidad y cumplimiento: ¿la imaginación lo hace así? Revista de Personalidad y Psicología Social, 43, 89–99.
Holbrook, AL y Krosnick. JA (2006). Sesgo de deseabilidad social en los informes de participación electoral: Pruebas
utilizando técnicas de conteo de ítems y respuesta aleatoria. Manuscrito presentado para su publicación.
Jones, EE y Nisbett, RE (1971). El actor y el observador: percepciones divergentes de las causas de la conducta. En EE
Jones, DE Kanouse, HH Kelley, RE Nishett, S. Valins y B. Weiner (Eds.), Atribución: Percibir las causas del
comportamiento (págs. 79–94). Nueva York: Prensa de aprendizaje general.
Kahneman, D. y Miller, DT (1986). Teoría de la norma: comparación de la realidad con sus alternativas. psi
Revisión psicológica, 93, 136–153.
Levine, B., Black, SE, Cabeza, R., Sinden, M., Mcintosh, AR, Toth, JP, Tulving, E. y Struss, DT (1998). Memoria episódica
y el yo en un caso de amnesia retrógrada aislada.
Cerebro, 121, 1951–1973.
Libby, LK, Eibach, RP y Gilovich, T. (2005). Aquí me miras: el efecto de la perspectiva de la memoria en las evaluaciones
del cambio personal. Revista de Personalidad y Psicología Social, 88, 50–62.
Moore, BS, Sherrod, DR, Liu, TJ y Underwood, B. (1979). El cambio disposicional en la atribución a lo largo del tiempo.
Revista de Psicología Social Experimental, 15, 553–569.
Nigro, G. y Neisser, U. (1983). Punto de vista en recuerdos personales. Psicología Cognitiva, 15,
467–482.
Piaget, J. (1932). El juicio moral del niño. Londres: Kegan Paul, Trench y Trubner.
Prencipe, A., & Zelazo, PD (2005). Desarrollo de la toma de decisiones afectivas para uno mismo y para los demás.
Ciencia Psicológica, 16, 501–505.
Pronin, E. y Ross, L. (2006). Diferencias temporales en la autoadscripción de rasgos: Cuando el yo es visto como otro.
Revista de Personalidad y Psicología Social, 90, 197–209.
Robinson, JA y Swanson, KL (1993). Modos de recordar de campo y de observador. memoria, 1,
169–184.
Singer, JL y McCraven, VG (1961). Algunas características de la ensoñación adulta. Revista de Psicología, 51,
151–164.
Tormentas, MD (1973). La cinta de video y el proceso de atribución: Invertir los puntos de vista de los actores y
los observadores. Revista de Personalidad y Psicología Social, 27, 65–175.
Tourangeau, R. y Smith, TW (1996). Hacer preguntas delicadas: el impacto del modo de recopilación de datos,
el formato de la pregunta y el contexto de la pregunta. Opinión pública trimestral, 60, 275–304.
8a. ¿Mi interpretación o la de los autores representa mejor los datos? En este caso, nuestra interpretación
es la misma que la de los autores. Sin duda, ese no siempre será el caso, especialmente al leer estudios
más largos y complejos.
8b. ¿Ofrezco yo o los autores la discusión más convincente de las aplicaciones e implicaciones de los
resultados? Los autores tienen una buena discusión, que incluye el punto interesante de que la
manipulación de la perspectiva visual afectó la participación electoral incluso en el contexto de una
campaña presidencial muy disputada en la que hubo muchos factores que potencialmente afectaron el
comportamiento electoral. Por lo tanto, los autores concluyen que las imágenes visuales deben tener una
influencia relativamente fuerte en el comportamiento. También señalan, como lo hicimos nosotros, que el
poder de las imágenes visuales podría usarse con un propósito para influir en el comportamiento. Sin
embargo, aunque nos enfocamos en la idea de que los organizadores políticos podrían usar imágenes
visuales para afectar el comportamiento de otras personas, los autores sugieren además que las personas
podrían usarlas por sí mismas para aumentar las posibilidades de que lleven a cabo sus propias buenas inten
8c. ¿Qué preguntas quedan sin respuesta? Para comprender mejor el poder de la perspectiva visual
para influir en el comportamiento, creemos que es importante comparar la votación con perspectiva en
tercera persona con la votación sin ninguna imagen visual. Los autores descubrieron que la perspectiva
en tercera persona aumentaba la votación en relación con la perspectiva en primera persona, pero ¿qué
tan probable habría sido que las personas votaran si no hubieran pasado por una tarea de visualización
en absoluto, sino que simplemente hubieran completado un cuestionario en línea en que se les hizo
preguntas sobre su actitud hacia la votación? Presumiblemente, los autores predecirían que la
visualización en tercera persona causaría un gran aumento en la votación en relación con la no
visualización, pero este estudio no habla directamente de esa posibilidad porque no incluye una condición
de no visualización.
8d. ¿Qué estudios adicionales podría hacer? Sería sencillo replicar las condiciones del
estudio actual y agregar una condición de no visualización en la que los sujetos sean
tratados exactamente igual que en las condiciones descritas aquí, excepto que no reciben
las instrucciones de visualización y no responden ninguna pregunta. preguntas sobre su
imagen. Por supuesto, un problema es que, si quisiera volver a estudiar cómo votar en
una elección presidencial, ¡podría tener que esperar hasta 4 años para hacerlo!
Obtuvo una idea, revisó la literatura pertinente, diseñó un procedimiento, recopiló sus
datos y analizó los resultados. Su curso puede requerir un registro escrito de su
investigación. Incluso si no es así, usted está obligado a publicar los resultados de un análisis c
Formato
El esquema de un informe típico en la Figura 5.2 enfatiza la secuencia de páginas que tendrá
que armar en su manuscrito de estilo APA. Esta versión del artículo se conoce como copia
manuscrita y se ensambla de manera particular para facilitar los procesos editoriales y de
publicación. Un recorrido por esa secuencia le dará una idea de lo que se supone que debe
incluir.
Su portada contiene el título de su proyecto, su nombre, su afiliación (su institución o
lugar de negocios) y su cabecera. El título abreviado que aparece en la parte superior de cada
página del manuscrito copia consta de las primeras palabras del título y se utiliza para
identificar el manuscrito únicamente durante el proceso editorial. El encabezado que aparecerá
en la parte superior de cada página de la publicación
El artículo se llama encabezado, y se escribe en letras mayúsculas en la portada de la copia
del manuscrito. El título abreviado y el encabezado no deben confundirse. Debe colocar doble
espacio en las líneas de la portada y cada dos páginas del manuscrito de la copia.
Procedimiento
2. Figura 2.
(Tablas sucesivas
están separados
páginas.)
ÿ FIGURA 5.2
Las referencias comienzan en una página separada. El formato para presentar las referencias es
complejo y debe tener cuidado al prepararlas. Consulte la Tabla 5.2 para ver las pautas de las fuentes
comúnmente citadas. También debe consultar el artículo reimpreso en este capítulo, que contiene la
mayoría de los diferentes estilos de referencias que deberá documentar. Mírelos cuidadosamente; si tiene
alguna pregunta, pregunte a su instructor. También puede estudiar el Manual de publicaciones de la APA
y artículos de revistas recientes. Las notas del autor y las notas al pie aparecen en páginas separadas
después de las referencias. Para la mayoría de los informes de laboratorio de la universidad, las notas al
pie no son necesarias.
Cuando prepara algo para su publicación, puede reconocer el apoyo financiero e intelectual, que debe
aparecer en la página de notas del autor. Los reconocimientos generales no están numerados. Otra
información, tal vez periférica, debe aparecer como notas al pie numeradas en una página de notas al pie
separada, pero tales notas al pie generalmente se desaconsejan.
Después de las notas al pie están las tablas de datos que se mencionan en la sección de resultados.
Cada tabla debe estar en una página separada y numerada correlativamente, de acuerdo con su aparición
en la sección de resultados. Haga que los títulos de sus tablas sean breves pero comunicativos.
Las leyendas de sus figuras están numeradas consecutivamente y aparecen en una página separada
Periódico (p. ej., diario) Autor, AA, Autor, BB y Autor, CC (1999). Título del artículo. Título de la publicación periódica, xx,
xxx–xxx.
No periódico (p. ej., libro) Autor, AA, Autor, BB, & Autor, CC (2004). Título de la obra. Lugar: Editorial.
Parte de una publicación no Autor, AA, Autor, BB y Autor, CC (2001). Título del capítulo. En A. Editor, B. Editor, &
periódica (p. ej., capítulo de un libro) C. Editor (Eds.), Título del libro (págs. xxx–xxx). Lugar: Editorial.
Documento en línea Autor, AA (2001). Título de la obra. Obtenido mes día, año, de la fuente.
siguiendo las tablas de datos. Finalmente, inserta sus cifras, cada una en una página separada. Las
tablas y figuras están separadas del texto, una por página, para facilitar el proceso de composición tipográfic
Como se mencionó antes, las copias de los manuscritos se organizan de esta manera para adaptarse
al editor. Sin embargo, debe tener en cuenta que hay una sección especial en el Manual de publicación
de la APA sobre el formato aceptado para los trabajos de los estudiantes presentados como requisito de
un curso, pero no para su publicación. Por ejemplo, en trabajos de estudiantes, se pueden intercalar
tablas y figuras en el texto. Debe consultar con su profesor o departamento sobre el formato preferido
para los proyectos de clase. Sin embargo, recomendamos aprender el formato de publicación APA porque
proporciona una buena práctica para preparar sus futuras publicaciones.
Manuscrito de muestra
Un manuscrito de muestra aparece en las siguientes páginas. La investigación que condujo a este
manuscrito fue realizada por el primer autor (David Gallo) y el segundo autor (Meredith Roberts) mientras
eran estudiantes universitarios en la Universidad de Wesleyan y trabajaban con el tercer autor (Dr. John
Seamon). La investigación comenzó como un proyecto en un curso de metodología en el que estaba
matriculado David Gallo, uno como el curso en el que están matriculados la mayoría de los estudiantes
que leen este texto. Estos estudiantes wesleyanos, con la ayuda de su profesor, convirtieron un proyecto
estudiantil en un artículo publicable que contribuyó a la literatura psicológica sobre la memoria humana.
Debe tener en cuenta la secuencia de páginas, dónde comienza a escribir en una nueva página y qué
información se proporciona en cada sección. Un aspecto que falta en este manuscrito y que puede
aparecer en uno de los suyos es una nota al pie de página separada. Además, puede optar por incluir
figuras que representen datos en forma gráfica además de (o en lugar de) tablas. Note cuidadosamente
cómo se citan las referencias en la sección de referencias. Un aspecto de este manuscrito que es diferente
del formato APA estándar es el uso del término sujetos en lugar de participantes. Aunque el formato APA
actual requiere el uso del término participantes para seres humanos que participan en la investigación,
algunas revistas no afiliadas a la Asociación Estadounidense de Psicología (como la que publicó el
siguiente artículo de investigación) permiten el uso de participantes o sujetos. Por lo tanto, el término
sujetos
se utilizó en este artículo a discreción de los autores.
La cita completa del siguiente artículo es: Gallo, DA, Roberts, MJ y Seamon, JG (1997). Recordar
palabras no presentadas en listas: ¿Podemos evitar crear falsos recuerdos? Psychonomic Bulletin &
Review, 4, 271–276. (Copyright 1997 por Psycho nomic Society Inc. Reimpreso con permiso de los
autores y el editor).
El texto continúa en la pág. 143
Recordando palabras 1
Universidad Wesleyana
Recordando palabras 2
Resumen
¿Pueden los sujetos evitar crear recuerdos falsos en Roediger y McDermott (1995) falso
paradigma de reconocimiento si se les advierte sobre esta ilusión de la memoria? Nosotros pre
sujetos enviados con listas de palabras relacionadas semánticamente, seguido de una prueba de reconocimiento.
La prueba estuvo compuesta por palabras estudiadas, palabras no estudiadas relacionadas semánticamente (crit
sobre el efecto de reconocimiento falso, se instó a un segundo grupo a minimizar todos los falsos
alarmas, y un tercer grupo fue advertido sobre el reconocimiento falso de señuelos críticos.
En comparación con los sujetos desinformados y cautelosos, los sujetos advertidos redujeron su tasa de falsas
con la misma frecuencia para palabras estudiadas reconocidas y señuelos críticos. Pero la advertencia no
eliminar el efecto de reconocimiento falso, ya que estos sujetos y los de los otros grupos
Recordando palabras 3
sobre las ilusiones de la memoria, Roediger (1996) proporcionó una descripción histórica de los errores en
percepción y memoria. Definió una ilusión de memoria como una instancia en la que un
el informe de una persona sobre un evento pasado se desvía seriamente del evento real. uno llamativo
ejemplo ofrecido como evidencia de una ilusión de la memoria fue el hallazgo de Deese (1959) de falso
recordar en un paradigma de aprendizaje de lista. Deese presentó sujetos con listas de semántica como
se asocia a palabras críticas no presentadas. Por ejemplo, para la palabra crítica "aguja",
la lista presentada constaba de hilo, alfiler, ojo, costura, afilado, punta, pinchado, dedal,
pajar, dolor, herida e inyección. Cuando a los sujetos se les dio una prueba de recuerdo libre
recuerda con más frecuencia que las palabras no presentadas pero no relacionadas. Este procedimiento
indujo a los sujetos a recordar palabras específicas que nunca se presentaron en las listas. Empezar
ning con Roediger y McDermott (1995), ha habido un resurgimiento del interés en este
paradigma para estudiar este efecto de memoria falsa (p. ej., McDermott, 1996; Payne, Elie,
resultado extendido de Deese. En su primer experimento, a los sujetos se les leyeron seis de
Listas de Deese que provocaron la mayor frecuencia de recuerdo falso. Después de que cada lista fue pre
enviado, a los sujetos se les dio una prueba de recuerdo libre, seguida de una prueba de reconocimiento después
todas las listas fueron retiradas. La prueba de reconocimiento estuvo compuesta por palabras estudiadas,
palabras críticas no estudiadas (en lo sucesivo denominadas señuelos críticos), y palabras no estudiadas
palabras no relacionadas. Roediger y McDermott encontraron que los señuelos críticos eran falsamente
La mitad de los sujetos recibieron una prueba de recuerdo libre después de cada presentación de la lista de estudio, y
Recordando palabras 4
los investigadores hicieron uso de la tarea de juicio recordar versus saber de Tulving (1985). Para cualquier palabra
reconocida, los sujetos tenían que indicar si recordaban específicamente la aparición de la palabra en el estudio (un
la palabra que había sido presentada en ausencia de cualquier recuerdo específico (un saber
más reconocimientos falsos de señuelos críticos que el estudio y la condición matemática. Cómo
nunca, los sujetos en ambas condiciones produjeron falsas alarmas a los señuelos críticos a tasas
que eran comparables a las tasas de aciertos correspondientes a las palabras estudiadas. Además, el
Los resultados mostraron que los señuelos críticos reconocidos a menudo se caracterizaban como recordados.
en la tarea de juicio recordar versus saber, especialmente en las condiciones de estudio y recuerdo
efecto de ción como una “poderosa ilusión de la memoria” (p. 803). Una ilusión que es tanto más
con intervalos de retención cortos, en un procedimiento de laboratorio de aprendizaje de listas que normalmente
produce pocos errores, y con memorizadores profesionales (estudiantes universitarios) como sujetos.
paradigma si estuvieran advertidos sobre esta ilusión de la memoria. Hasta donde sabemos, no
uno ha determinado específi camente si este efecto de memoria falsa podría ser disminuido o
eliminado por el conocimiento de los sujetos, pero investigaciones previas han preguntado si diferentes
las condiciones experimentales podrían infl uir en este efecto. Por ejemplo, McDermott (1996,
Experimento 2) dio a los sujetos múltiples pruebas de estudio y recuerdo con las mismas listas de palabras
produjo menos recuerdo falso que la presentación bloqueada, pero ambas formas de presentación
todavía produjo recuerdos falsos después de múltiples ensayos de prueba de estudio o una prueba de recuerdo final dada 24 h
luego. Payne et al. (1996) observaron un efecto similar al mostrar que el reconocimiento de
los señuelos críticos no disminuyeron durante un intervalo de retención de 24 h. Finalmente, Read (1996) ma
instrucciones de codificación anuladas haciendo que los sujetos memoricen el orden de las palabras o participen
Recordando palabras 5
tres condiciones de codificación produjeron altos niveles de recuerdo falso para palabras críticas, pero el
los recuerdos falsos fueron más bajos para los sujetos que se centraron en el orden de las palabras. Estos estudios
indican que este efecto de memoria falsa persiste a través de múltiples estudios y ensayos de prueba
(McDermott, 1996), un retraso de 24 horas entre el estudio y la prueba (McDermott, 1966; Payne et al., 1996) y un
Pero la memoria falsa para las palabras críticas disminuye cuando las palabras se asignan al azar.
sobre listas (McDermott, 1996) o los sujetos intentan memorizar el orden de las palabras en el estudio
(Leer, 1996).
El reconocimiento de señuelos críticos podría atenuarse o eliminarse mediante el uso de advertencias previas.
instrucciones. Curiosamente, no encontramos investigaciones publicadas sobre los efectos del conocimiento previo.
ventaja sobre las ilusiones perceptivas o de la memoria. Para las ilusiones perceptivas, tal investigación puede
han sido innecesarios ya que Gregory (1987) señala que estas ilusiones ocurren incluso cuando
la gente sabe que está percibiendo una ilusión. Por ejemplo, podemos saber que
las líneas en la ilusión de Muller-Lyer tienen la misma longitud, pero una línea todavía parece ser
más largo que el otro. Las ilusiones perceptivas nos engañan porque los procesos perceptivos funcionan
proceso de formar un precepto (Gregory, 1987). Las ilusiones de la memoria también nos engañan, pero lo hacen
por lo tanto, durante un marco de tiempo más prolongado que incluye condiciones de estudio y prueba. Memoria
Las ilusiones pueden, por lo tanto, brindar una mayor oportunidad que las ilusiones perceptivas para ser influenciadas.
por el conocimiento del sujeto. En la medida en que se pueda utilizar el conocimiento previo
durante la codificación o recuperación para idear estrategias cognitivas compensatorias, una ilusión
Las únicas declaraciones que encontramos sobre los efectos del conocimiento previo en falso
memoria están ubicados en dos lugares en la investigación de Roediger y McDermott (1995). Una
La declaración sugiere que la advertencia previa podría ser efectiva para minimizar el reconocimiento falso.
ción de señuelos críticos, mientras que la otra declaración sugiere poco efecto de advertencia.
Recordando palabras 6
Por ejemplo, los autores notaron que eliminaron el único tema de su análisis
hermana que no tenía recuerdos falsos de las palabras críticas porque al final del Experimento
sujeto informó que “notó que las listas parecían diseñadas para hacerla pensar
de una palabra no presentada” (p. 808) Este sujeto puede haber adoptado una estrategia que
sujetos seleccionados, como estudiantes graduados astutos que sabían que estábamos tratando de inducir
falsos recuerdos” todavía producía un fuerte efecto de falso recuerdo (p. 812). En la medida
que estos sujetos estaban completamente informados sobre la ilusión de la memoria antes del estudio, esto
La observación sugiere que la advertencia previa tendrá un efecto mínimo en el reconocimiento falso.
comparar grupos de sujetos con diferentes conjuntos de instrucción en una versión modificada
este efecto de memoria falsa es una ilusión de memoria que funciona como una ilusión perceptual,
el conocimiento previo del efecto puede tener poco o ningún efecto en el reconocimiento de críticas
llamar señuelos. Pero si esta ilusión de la memoria difiere de las ilusiones perceptivas en que permite
mayor oportunidad para que el rendimiento se vea influido por la codificación o la estrategia de recuperación
gies, el conocimiento previo de la ilusión debería atenuar el efecto en la medida en que la gente
listas de palabras relacionadas semánticamente para estudiar, seguidas de una prueba de reconocimiento después de todo
prueba para minimizar todas las falsas alarmas, y un tercer grupo fue advertido de la específi c
ilusión por una demostración e instrucciones antes del estudio. Basado en Roediger
y los hallazgos de McDermott, planteamos la hipótesis de que los sujetos en el grupo desinformado
Recordando palabras 7
grupos advertidos proporcionan nuevas condiciones de prueba y, en comparación con los desinformados
Método
Asignaturas
Los sujetos fueron 48 estudiantes universitarios de Wesleyan University que sirvieron como
Materiales
Usamos 16 de las 24 listas de palabras de Roediger y McDermott para el estudio y las palabras de prueba
(ver su apéndice). Cada lista estaba compuesta por 15 asociados a una crítica no presentada.
palabra cal (es decir, un señuelo crítico). Dentro de una lista, el orden de las palabras era constante y
los asociados más fuertes al señuelo crítico normalmente ocurrían primero. por ejemplo, el
La lista asociada con el señuelo crítico del sueño constaba de las siguientes palabras: cama, descanso,
despierto, cansado, soñar, despertar, dormitar, manta, dormitar, dormir, roncar, siesta, paz, bostezar y somnoliento.
Para fines de contrapeso, las 16 listas se dividieron en dos conjuntos de 8 listas, etiquetados A y B. La mitad de los
estudio y la otra mitad recibió el Juego B. El juego que no se usó durante el estudio proporcionó elementos de distracción para
la prueba de reconocimiento.
Procedimiento
Durante el estudio, a los sujetos se les presentó una cinta auditiva que contenía ocho
listas de 15 palabras presentadas en bloques. Las palabras fueron pronunciadas por un hombre.
voz a razón de 1,5 s por palabra, y un tono separaba cada lista. Los sujetos, que
fueron evaluados en grupos de hasta 6, se les dijo que recordaran las palabras para un reconocimiento
Después de escuchar las 120 palabras del estudio, los sujetos recibieron un reconocimiento visual
prueba de memoria que consta de 64 palabras. Siguiendo la prueba profesional de Roediger y McDermott
procedimiento, esta prueba contenía tres ítems de cada lista estudiada (posiciones de serie 1, 8,
y 10), el señuelo crítico no presentado de cada lista estudiada, tres ítems de cada
Recordando palabras 8
lista ied, todos enumerados en un orden aleatorio. Cada palabra iba acompañada de un signo más (1) y
Los sujetos fueron instruidos para examinar las palabras en orden secuencial en un auto
tasa de ritmo y tomar una decisión para cada palabra en la lista. Se les dijo que circularan
el signo más para cualquier palabra que reconocieron de la cinta de estudio o el signo menos
firmar por cualquier palabra que no reconocieron. Además, siguiendo a Tulving (1985), la
Se instruyó a los sujetos para que hicieran un juicio de recuerdo o conocimiento para cada
palabra marcando con un círculo R o K en sus hojas de respuestas. Se les dijo a los sujetos que encerraran en un círculo la R si
estaban seguros de que se presentó la palabra, pero no pudieron recordar su aparición real
o cualquier detalle relacionado. Estas instrucciones para los juicios de recordar y saber fueron
similares a los utilizados por Rajaram (1993) y Roediger y McDermott (1995). Después
ness de la organización de las listas de palabras en el estudio y pidió una descripción de cualquier
La variable de interés principal en este experimento fue el efecto del conocimiento previo
sobre el efecto de la falsa memoria. En consecuencia, tres grupos de 16 sujetos recibidos difieren
habló sobre el efecto de reconocimiento falso. En su lugar, se les dieron instrucciones estándar
para tratar de recordar tantas palabras como sea posible para una prueba de reconocimiento posterior. Este
Experimento 2).
En la condición de cautela, los sujetos también estaban desinformados sobre la falsa rec
efecto de cognición durante el estudio, pero se les pidió que tuvieran cuidado en el reconocimiento
prueba para minimizar sus falsos reconocimientos a todas las palabras. Esta condición fue
diseñado para determinar si el mero hecho de pedir a los sujetos que fueran cautelosos era suficiente para
Recordando palabras 9
minimizar el efecto de reconocimiento falso para señuelos críticos. A diferencia de los sujetos en el unin
condición formada que no recibió información sobre las palabras utilizadas en el reconocimiento
prueba de ción, a estos sujetos se les dijo que algunas palabras en la prueba eran similares a palabras
escuchados en el estudio, pero en realidad no fueron presentados. No se proporcionó ninguna otra información.
liza. Debido a que a los sujetos se les dijo específi camente que las listas de estudio estaban diseñadas para
tratar de hacerles reconocer falsamente palabras relacionadas pero no presentadas, esta condición al
sujetos reducidos la oportunidad de idear estrategias para reducir o eliminar el falso reconocimiento
efecto de nición. Como parte del procedimiento de preaviso, los sujetos participaron en una falsa
demostración de reconocimiento antes de que se dieran las instrucciones para el experimento real.
A los sujetos se les leyó una lista de muestra de palabras y se les dijo que se les daría una
Después de la presentación de la lista de muestra, los sujetos recibieron un rec de ocho palabras
Prueba de reconocimiento, construida de la misma manera que nuestra prueba real. tres de las palabras
eran de la lista de muestra (posiciones de serie 1, 8 y 10), una palabra era la nonpre
envió un señuelo crítico, y cuatro palabras fueron distractores no relacionados tomados de otro
La lista de Roediger y McDermott no se volvió a utilizar en este experimento. Después de las materias
A estos sujetos se les informó además que investigaciones previas habían demostrado que
condujo a altos niveles de falso reconocimiento de los señuelos críticos. Esta discusión fue fol
seguido de una lectura de otra lista de muestra de 15 palabras relacionadas, junto con su crítica
señuelo de otra lista de Roediger y McDermott que no se volvió a utilizar en este experimento
mento A los sujetos se les dijo que las listas que escucharían en el estudio estaban
estructurado de la misma manera que las listas de muestra. Su tarea era minimizar las falsas
Recordando palabras 10
estudiar. Se tuvo cuidado de asegurar que los sujetos entendieran la manera en que
se construyeron las listas de estudio, la naturaleza del efecto de reconocimiento falso y el objetivo de
Se recordaba a los sujetos su tarea. Juntos, estos procedimientos proporcionan una fuerte prueba de
Resultados
Los datos primarios consistieron en las respuestas a la prueba de reconocimiento para sujetos en
juicios para todas las palabras que fueron reconocidas. Estos resultados se muestran en
La Tabla 1 indica que la tasa de aciertos de las palabras estudiadas varió entre los grupos, y esto
observación fue apoyada por los resultados de un análisis de varianza, F (2, 42) = 4.62,
M Se = .02, p < .02. La tasa de aciertos para el grupo desinformado (.76) fue mayor que la
para el grupo cauteloso (.65), t(30) = 2.33, SEM = .05, p < .05, y los prevenidos
(.63), t(30) = 3.01, SEM = 04, p < .01, mientras que las tasas de acierto para los cautelosos y
los grupos preavisados no variaron, t < 1. También hubo un efecto de los grupos sobre los falsos
tasa de reconocimiento para señuelos críticos, F(2, 42) = 11.05, MSe = .05, p < .001, como la tasa para
el grupo advertido (.46) fue menor que el del grupo no informado (.81),
t(30) = 4.84, SEM = .07, p < .001, y el grupo cauteloso (.74), t(30) = 3.36,
SEM = .08, p < .01. Las tasas de falsa alarma para señuelos críticos para los desinformados y cau
varios grupos no variaron, t < 1, y no hubo un efecto general de los grupos sobre el falso
tasas de alarma para palabras no estudiadas o señuelos críticos no relacionados, ambas F < 1.
Además de producir la tasa de aciertos más alta, el grupo desinformado también produjo
un fuerte efecto de memoria falsa al reconocer falsamente los señuelos críticos no presentados
(.81) al menos con la misma frecuencia que las palabras estudiadas (.76), t(15) = 1.25, SEM < .04,
p > .10. En la tarea de juicio recordar versus saber, estos sujetos seleccionaron
recuerda las respuestas con más frecuencia que las respuestas conocidas para los estudios estudiados reconocidos
Recordando palabras 11
palabras, t(15) = 4.43, SEM = .06, p < .001, y señuelos críticos reconocidos falsamente, t(15) = 2.40, SEM
< .11, p < .05. Sus tasas de falsas alarmas para palabras no estudiadas y
los señuelos críticos no relacionados eran los mismos (.15), y la mayoría de estas falsas alarmas eran
juzgados como respuestas conocidas. Estos resultados replican de cerca los resultados de Roediger y McDermott.
(Experimento 2, Tabla 2) resultados e indican que cuando los sujetos no están informados sobre
esta ilusión de la memoria, no pueden diferenciar los elementos de la lista de los relacionados semánticamente, pero
artículos no presentados.
El hallazgo de que los sujetos en el grupo cauteloso tuvieron un resultado general significativamente más bajo
tasa de aciertos y tasas de falsas alarmas no significativamente más bajas que los sujetos en el desinformado
El grupo sugiere que las instrucciones para ser cauteloso infl uyeron en el reconocimiento realizado.
mance Pero a pesar de que estos sujetos ejercieron cautela, todavía demostraron
un efecto de memoria falsa al reconocer señuelos críticos (0,74) al menos con la misma frecuencia que las
palabras estudiadas (0,65), t(15) = 1,8, SEM < 0,05, p > 0,05. Sin embargo, estos sujetos, que seleccionaron respuestas
de recordar sobre respuestas de saber para palabras estudiadas reconocidas, t (15) = 2.67, SEM < .06, p < .05, no
señuelos, t < 1. Sus tasas de falsas alarmas fueron las mismas para palabras no estudiadas y palabras no relacionadas.
señuelos críticos (.12), y la mayoría de estas falsas alarmas fueron juzgadas como respuestas conocidas.
Estos resultados indican que instruir a los sujetos para que sean cautelosos puede reducir la tasa de aciertos para
palabras estudiadas y reducir la probabilidad de que los señuelos críticos reconocidos falsamente sean
juzgado como recordado de las listas anteriores. Pero tales instrucciones no disminuyen la
Efecto de falso reconocimiento. Simplemente pedirle a la gente que tenga cuidado con sus falsas alarmas
Lo que es más importante, los sujetos del grupo advertido tenían una tasa de aciertos general más baja.
y una tasa de falsas alarmas más baja para los señuelos críticos que los sujetos del grupo no informado.
Al mismo tiempo, tenían una tasa de aciertos comparable y un falso señuelo crítico más bajo.
tasa de alarma que los sujetos en el grupo cauteloso. Estos temas aún se hicieron más falsos
reconocimientos de señuelos críticos (0,46) que señuelos críticos no relacionados (0,14), t(15) = 5,39, SEM =
0,06, p < 0,001, lo que demuestra la persistencia del efecto de memoria falsa.
Recordando palabras 12
Pero su tasa más baja de reconocimiento falso de señuelos críticos, en relación con esa tasa para cualquiera
los grupos desinformados (.81) o cautelosos (.74), y su menor tasa de reconocimiento falso
ción de señuelos críticos en relación con su tasa de éxito, t (15) = 3.2, SEM = .05, p < .01, indica
que las instrucciones de advertencia disminuyeron el efecto de falso reconocimiento. Además, a diferencia de
saber juicios para cualquiera de las palabras estudiadas reconocidas, t (15) = 1.0, SEM = .05,
p > .10, o señuelos críticos, t(15) = 1.3, SEM = .08, p > .10. Como en las condiciones anteriores,
las tasas de falsas alarmas para palabras no estudiadas y señuelos críticos no relacionados fueron las mismas
(.14), con la mayoría de estas falsas alarmas juzgadas como respuestas conocidas. Estos resultados
demostrar que las instrucciones de advertencia pueden reducir la magnitud de las falsas notificaciones
mento Fue diseñado para proporcionar información sobre el conocimiento de los sujetos de la lista de estudio.
la prueba de reconocimiento. Para los sujetos en el grupo cauteloso, estábamos interesados en disuadir
minar cómo podrían reducir sus falsas alarmas a todas las palabras no estudiadas, mientras que para
micen su susceptibilidad para reconocer señuelos críticos. Declaración escrita de cada sujeto.
escrito. Esas categorías consistían en lo siguiente: ninguna estrategia indicada (estas sub
en el sonido de cada palabra de la lista o las repitió en silencio durante el estudio), elaborativo
ensayo (estas asignaturas se centraron en temas de lista al vincular palabras de estudio por semántica
Recordando palabras 13
recuerde el señuelo crítico de cada lista). La tabla 2 muestra el número de sujetos en cada
categoría de cada grupo, junto con la tasa de acierto promedio correspondiente para el estudio
palabras y tasa de falsas alarmas para señuelos críticos. Tasas de falsas alarmas para palabras no estudiadas
y los señuelos críticos no relacionados no se incluyeron porque estas tasas eran bajas en cada
Los resultados que se muestran en la Tabla 2 indican que los sujetos en el desinformado y cau
Varios grupos produjeron un patrón similar de Resultados. Estos sujetos eran más aptos para
Informar que usaron el Ensayo elaborativo como su medio principal para recordar
estrategia dirigida a determinar los señuelos críticos (5 de 32 o .16). Aunque estos sub
Los sujetos utilizaron espontáneamente procesos de elaboración que suelen ser más efectivos.
que los procesos de mantenimiento para recordar las palabras de estudio (p. ej., Craik & Watkins,
No trate de determinar los señuelos críticos por su cuenta. Esto fue cierto incluso después de que los sujetos
en el grupo cauteloso se les dijo que algunas palabras de prueba no presentadas serían similares
para estudiar palabras. En la Tabla 2 se observa un patrón de resultados muy diferente para los sujetos en
el grupo advertido. La estrategia informada con mayor frecuencia para estos sujetos fue
para determinar los señuelos críticos. Los ensayos elaborados o de mantenimiento se realizaban con poca frecuencia.
Los resultados en la Tabla 2 hacen dos puntos importantes. El primer punto es que el en
Las instrucciones dadas a los sujetos en esta tarea infl uyeron en el tipo de estrategia que se
usó. Cuando a los sujetos simplemente se les dijo que serían evaluados en listas de palabras
(grupo desinformado) o instado a ser cauteloso para una prueba (grupo cauteloso), la mayoría
actuación. Sin embargo, cuando se les dijo de antemano sobre la ilusión de la memoria
(grupo prevenido), muchos de estos sujetos trataron de determinar el punto crítico específi co
señuelos que pueden aparecer en la prueba de reconocimiento. El segundo y más importante punto
Recordando palabras 14
es que los sujetos en todas las condiciones eran susceptibles al efecto de reconocimiento falso, re
la mayoría de los sujetos, el falso reconocimiento de señuelos críticos fue mayor para los sujetos en el
grupos desinformados (.89) y cautelosos (.82) que usaron ensayo elaborativo que sub
jects en el grupo advertido (.45) que trató de determinar los señuelos críticos. Pero ten en cuenta que
incluso aquellos sujetos en el grupo advertido que trataron de encontrar señuelos críticos falsamente
reconoció a casi la mitad de ellos. Esos sujetos entendieron las instrucciones de advertencia.
ciones y trató de minimizar el efecto de reconocimiento falso, sin embargo, todavía estaban infl uenciados
por la ilusión de la memoria que estaban tratando activamente de resistir. Claramente, la advertencia en
Como parte de una reunión regular de la clase del tercer autor (Psicología 221, Human
descripción detallada del experimento de Roediger y McDermott, junto con una lista de muestra
y señuelo crítico. El instructor luego les informó que se les leerían 8 listas de
palabras, y su trabajo consista en idear una estrategia para minimizar el falso reconocimiento de crti
llamar señuelos. Las listas de estudio y la prueba de reconocimiento se construyeron de la misma manera que
el presente experimento. Las listas se leyeron a una velocidad de aproximadamente 1,5 s por palabra,
y recordar y saber que los juicios no se hicieron en la prueba. Los resultados estrechamente paralelos
lideraron a los del grupo advertido en el presente experimento para la tasa de aciertos (.67),
falsas alarmas para señuelos críticos (.49) y falsas alarmas para palabras no estudiadas (.19) y
señuelos críticos no relacionados (.22). A pesar de que los estudiantes de memoria todavía reconocían falsamente
señuelos críticos mayores que señuelos críticos no relacionados, t(24) = 7.57, SEM = .04, p < .001,
su nivel de reconocimiento falso de señuelos críticos fue menor que su tasa de aciertos para los señuelos estudiados
palabras, t(24) = 3.40, SEM = .05, p < .01. Estos hallazgos indican que la memoria
los estudiantes eran susceptibles a esta ilusión de la memoria, aunque a un nivel atenuado.
Recordando palabras 15
Por lo tanto, tanto en un entorno de laboratorio formal como en un entorno de aula menos formal,
Las instrucciones de advertencia sirvieron para disminuir pero no eliminar el efecto de esta
ilusión de la memoria.
Discusión
El estudio demostró varios puntos importantes. Primero, cuando los sujetos no estaban
a su tasa de aciertos para las palabras estudiadas, y era más probable que indicaran que
recordaba específi camente esas palabras del estudio que simplemente sabía que eran
presentado. En segundo lugar, cuando se instó a los sujetos a ser cautelosos con las falsas alarmas para
en pocas palabras, todavía demostraron un fuerte efecto de reconocimiento falso como su falsa alarma
la tasa de señuelos críticos fue comparable a su tasa de aciertos para las palabras estudiadas. Sin embargo,
Las instrucciones para ser cauteloso disminuyeron la probabilidad de que los críticos reconocieran falsamente
los señuelos serían recordados del estudio. En tercer lugar, cuando los sujetos fueron advertidos acerca de
sujetos redujeron su tasa de falsas alarmas para señuelos críticos, y les hicieron recordar y
conoce juicios con la misma frecuencia para palabras estudiadas reconocidas y señuelos críticos. Cuatro,
palabras de estudio, mientras que muchos sujetos en el grupo advertido trataron de determinar el
señuelos críticos. Los sujetos del grupo advertido que buscaban los señuelos críticos eran
aún susceptible a la ilusión de la memoria. Finalmente, los efectos de la advertencia sobre las falsas
Se demostró que el reconocimiento era confiable por los resultados de una demostración en clase.
Nuestro hallazgo de que las instrucciones de advertencia disminuyeron pero no eliminaron las falsas
siones. Anteriormente, Roediger y McDermott (1995) sugirieron que el efecto de memoria falsa
funciona como una ilusión perceptiva cuando afirmaron que "así como las ilusiones perceptivas
puede ser convincente incluso cuando las personas son conscientes de los factores que dan lugar a la
Recordando palabras 16
ilusión, sospechamos que lo mismo es cierto en nuestro caso de recordar eventos que nunca
sucedió." (pág. 812). Nuestros resultados no están en desacuerdo; tanto informados como desinformados
sujetos falsamente reconocidos señuelos críticos. Los procedimientos actuales permitieron prevenido
sujetos la oportunidad de idear estrategias para reducir su susceptibilidad a los señuelos críticos.
Sin embargo, aunque muchos sujetos de este grupo trataron de determinar esos señuelos críticos,
Todavía reconoció falsamente a casi la mitad de ellos. Esta ilusión de la memoria, puede ser infl uenciada por una
conocimiento del sujeto porque los procedimientos utilizados en esta tarea dan tiempo para ese conocimiento
borde a utilizar. Pero incluso cuando los sujetos estaban armados con este conocimiento, las falsas recomendaciones
Todavía ocurrieron reconocimientos. Dados los extensos procedimientos de entrenamiento usados en los prevenidos
condición, no es obvio cómo podríamos haber informado mejor a nuestros sujetos sobre este
ilusión, ni está claro que exista una mejor estrategia para conjurar su efecto que tratar de disuadir
mina los señuelos críticos. Esta estrategia no fue del todo efectiva, y su efectividad
se espera que disminuya a medida que el número de listas de estudio crece más que el espacio de memoria.
Claramente, incluso los sujetos informados cometen errores de memoria en esta tarea.
Para explicar esta ilusión de la memoria, algunos investigadores han adoptado el método de Underwood.
(1965) hipótesis de respuesta de activación implícita que sugiere que cuando los sujetos codifican
palabras, piensan en asociados semánticos a esas palabras en el estudio (por ejemplo, Roediger &
de palabras relacionadas semánticamente puede activar representaciones para señuelos críticos porque
son los asociados semánticos más altos de los elementos de la lista. En el reconocimiento posterior
prueba de ción, los sujetos pueden reconocer falsamente esas palabras sobre la base de un estímulo implícito
familiaridad o recuperación explícita del contexto de estudio. Si las representaciones para el criti
los señuelos de llamadas no se activan conscientemente en el estudio, los sujetos pueden reconocer falsamente esos
palabras en la prueba, pero pueden ser más aptos para decir que saben que esos elementos fueron
representaciones se activaron conscientemente en el estudio, los sujetos pueden no solo reconocer falsamente
reconocer esos artículos, también pueden decir que recuerdan su presentación. En ambos
instancias, los sujetos estarían cometiendo un error de monitoreo de fuente sobre los señuelos críticos.
Los sujetos advertidos en el presente experimento pueden haber reducido tanto su falsa
Recordando palabras 17
cualquier señuelo en la prueba que se activó conscientemente en el estudio y se identificó como relacionado, pero
palabras no estudiadas. Sin embargo, estos sujetos seguirían siendo propensos a falsos reconocimientos,
aunque a una tasa más baja y con una menor frecuencia de juicios de recuerdo que el otro
condiciones, porque todavía podrían ser engañados por señuelos críticos que fueron inconscientemente
Finalmente, los psicólogos saben desde hace mucho tiempo que los errores de memoria ocurren en situaciones que no son de laboratorio.
(p. ej., Bartlett, 1932; Munsterberg, 1908) y actualmente existe un gran control
1993). No pretendemos que el presente paradigma ofrezca un método general para estudiar
la memoria falsa o que los hallazgos actuales pueden generalizarse a los recuerdos del niño
abuso (ver Freyd & Gleaves, 1996, y Roediger & McDermott, 1996, para comentarios
sobre estos temas). Más bien, creemos que la presente investigación de reconocimiento falso tiene práctica.
valor tico en la comprensin del grado en que el conocimiento se puede utilizar para inocular
una persona contra un efecto de memoria falsa. ¿Son los errores de memoria siempre propensos a plagar
condiciones bajo las cuales es probable que ocurran? Nuestros hallazgos sugieren que la inoculación
por el conocimiento puede lograr sólo un éxito limitado ya que las personas bien informadas sólo pueden
Referencias
Craik, FIM y Watkins, MJ (1973). El papel del ensayo en la memoria a corto plazo.
Recordando palabras 18
518–537.
Münsterberg, H. (1908). En el estrado de los testigos: Ensayos sobre psicología y crimen. Nuevo
ing palabras que no se presentan en las listas. Revista de Psicología Experimental: Aprendizaje,
Recordando palabras 19
Se expresa agradecimiento a Chun Luo por sus útiles comentarios sobre un borrador anterior de
este papel. Esta investigación fue apoyada por una Beca Wesleyana en Apoyo de Scholar
wesleyan.edu).
Recordando palabras 20
tabla 1
Condición desinformada
Lista de palabras
Señuelos críticos
Condición cautelosa
Lista de palabras
Señuelos críticos
Grupo Prevenido
Lista de palabras
Señuelos críticos
Recordando palabras 21
Tabla 2
Aciertos por palabras estudiadas y falsas alarmas por señuelos críticos según estrategias autoinformadas
Estrategia autoinformada
No informado
norte 3 2 8 3
Precavido
norte 4 1 9 2
advertido
norte 4 2 3 7
Nota: N representa el número de sujetos; los aciertos y las falsas alarmas son proporciones.
Su título debe ser corto (10 a 12 palabras) y conciso. Por lo general, el título establece las variables
independientes y las variables dependientes.
Su resumen debe incluir sus variables (independientes, dependientes y variables de control
importantes), número y tipo de sujetos, resultados principales y conclusiones importantes. Debido a que el
resumen no debe exceder las 180 palabras, indique solo el aspecto más esencial del artículo. El cuerpo de
su informe debe ampliar el resumen.
(Esta es la razón por la que la mayoría de los resúmenes se escriben al final, aunque el informe podría ser
más claro si el resumen se escribiera primero, como un resumen de la parte principal del trabajo).
En la introducción, debe indicar por qué está interesado en un tema en particular, qué han encontrado
otros investigadores y qué variables examinará. Debe comenzar expresando una perspectiva amplia sobre el
tema, luego limitarse rápidamente a la pregunta específica que le interese. Debe guiar al lector a través de la
investigación relevante, siempre teniendo en cuenta que está configurando su propia pregunta de
investigación. Por lo tanto, evite la discusión de cuestiones tangenciales. Hacia el final de la introducción,
brinde al lector una descripción general de su experimento, especificando sus hipótesis explícitamente y
describiendo cualquier predicción derivada de las teorías que ha discutido. Al final de la introducción, el lector
debería ver que su experimento llena un vacío importante en nuestro conocimiento.
En la sección de método, indique cómo examinó las variables que describió al final de la introducción.
Aquí, es importante ser claro y completo. Por
ÿ TABLA 5.3
Sección Información
Título Experimentos: Estado de variables independientes y dependientes: “Los efectos de X sobre Y”.
Otros estudios: Indique las relaciones examinadas: “La relación entre X e Y”.
Resumen En 180 palabras o menos, indique qué se hizo a quién y resuma los resultados más importantes.
Introducción Indique lo que planea hacer y por qué (es posible que tenga que revisar los resultados de investigaciones relacionadas).
claridad use subtítulos (Participantes, Aparatos, etc.) y asegúrese de que dependiente, independiente,
el propósito de la investigación.
Discusión Indique cómo se relacionan los resultados con las hipótesis o predicciones establecidas en la introducción. Inferencias y
Una vez que haya decidido sus palabras y frases, júntelas con cuidado. Un problema común entre
algunos escritores es cambiar abruptamente los tiempos verbales. En general, use el tiempo pasado
en la revisión de otros estudios en su introducción (Smith encontró) y en su método (los sujetos fueron).
Cuando está describiendo y discutiendo sus datos, el tiempo presente suele ser apropiado (Los datos
muestran que . . . , lo que significa eso).
Asegúrese de que los sustantivos colectivos y plurales concuerden con sus verbos y pronombres.
Las palabras en plural que terminan en a son problemáticas, como datos, criterios y fenómenos.
Cada uno de estos sustantivos es plural, por lo que requieren verbos y pronombres en plural. “Estos
datos son” es correcto, pero “este fenómeno es” es incorrecto. Las formas singulares de estos
sustantivos son: dato, criterio y fenómeno (este fenómeno es).
Muchos escritores científi cos abusan de la voz pasiva en sus informes. Considere esta
declaración: “Se piensa que el olvido es causado por la interferencia”. Aunque esta oración es bastante
concisa (y es precisa), también es sofocante y menos directa que "Creemos que la interferencia causa
el olvido", que es realmente lo que quiso decir el escritor. Tenga cuidado con el uso excesivo de la voz
activa o pasiva. Si abusa de la voz pasiva, su informe suena sofocante. Si abusa de la voz activa,
puede desviar el interés de lo que hizo y poner demasiado énfasis en sí mismo (creo, lo hice, etc.). Si
desea enfatizar qué se hizo y no quién lo hizo y por qué, use la construcción pasiva. Por otro lado, si
crees que el agente de la actividad también es importante, o si el motivo de la acción es importante,
usa la voz activa.
El escritor cuidadoso evita el lenguaje sexista. La APA recomienda que se evite el uso de él (y su
y él) como pronombre genérico cambiando a una construcción plural o usando él y ella. En general, el
escritor debe esforzarse por lograr una comunicación precisa e imparcial. El Manual de publicaciones
de la APA contiene una sección dedicada a la reducción del sesgo lingüístico.
La escritura científi ca requiere el uso de terminología consistente; si asigna etiquetas a las cosas
(p. ej., etiquetando grupos de sujetos: informados y no informados), use estas etiquetas en todo el
documento. Es posible que en las clases de inglés te hayan enseñado a tratar de variar las
descripciones de cosas repetitivas para evitar aburrir al lector. Sin embargo, en la escritura científi ca,
cambiar la terminología solo agrega confusión. Es importante que el lector sepa que cuando introduce
un nuevo término, se refiere a un concepto diferente a los discutidos anteriormente.
Escribir un artículo de investigación convincente y bien organizado es una habilidad que requiere
un esfuerzo y una práctica considerables. Se trata de algo más que simplemente asignar información
a las secciones correctas. Hay muchos puntos finos de estilo, uso y exposición que distinguen los
artículos lúcidos y bien escritos de los oscuros y tortuosos. Mientras escribe su informe, debe hacer
uso frecuente de referencias estándar para puntos de estilo y gramática.
Publicar un artículo
Suponga que su artículo ha sido escrito, revisado y corregido, y que la última página acaba de
salir de su impresora. ¿Ahora que? Aunque es poco probable que el primer esfuerzo de su
estudiante produzca un artículo de calidad profesional, puede encontrar interesante descubrir
qué sucede cuando un psicólogo profesional envía un artículo a una revista.
El primer paso es enviar copias del manuscrito (el término técnico para un trabajo inédito)
a un pequeño número de asociados de confianza que pueden revisarlo para asegurarse de
que no tenga fallas obvias o elementales y que esté escrito. claramente. Una vez que regresan
los comentarios, se hacen las correcciones indicadas y, con cierta inquietud, el autor envía el
manuscrito al correo, dirigido al editor de la revista más apropiada. Después de este paso, es
necesario tener mucha paciencia durante los próximos meses. El proceso de revisión es lento.
(El editor que recibe el manuscrito generalmente está extremadamente ocupado haciendo
malabarismos con muchas responsabilidades: enseñar, realizar su propia investigación,
supervisar a estudiantes de pregrado y posgrado, etc.). Dos o tres semanas después de enviar
el artículo, el autor recibe una carta modelo agradeciéndole su interés en la revista y acusando
recibo del manuscrito. El manuscrito recibe un número (como 04-145), y si se ha asignado un
editor asociado para que lo maneje, se le indica al autor que dirija toda la correspondencia
futura a ese editor.
El editor envía copias del manuscrito a dos o tres revisores. Algunas revistas permiten
que el autor tenga una revisión anónima (o ciega), donde se oculta la identidad del autor. Esto
es para aquellos que no creen en la imparcialidad de los revisores. El revisor, que también
puede revisar para varias otras revistas, coloca el manuscrito en la pila sobre su escritorio. Un
revisor concienzudo puede tardar uno o dos días en leer y evaluar cuidadosamente un
manuscrito. Luego, el revisor envía una declaración resumida al editor. Cuando los revisores
están de acuerdo, la decisión del editor es fácil. Si los revisores no están de acuerdo, el editor
debe leer detenidamente el manuscrito y, en ocasiones, puede solicitar otra opinión. Finalmente,
se llega a una decisión editorial y el autor recibe una carta que indica (1) por qué no se puede
publicar el manuscrito, (2) qué tipo de revisiones se necesitan para que el manuscrito sea
aceptable o (3) que la revista publicará el artículo. . Debido a que las tasas de rechazo de
manuscritos son bastante altas en la mayoría de las revistas (más del 70 por ciento), los
editores dedican mucho tiempo a diseñar cartas de rechazo con tacto.
Ya sea que el artículo haya sido aceptado o no, los comentarios de los revisores son muy
valiosos. Los mejores psicólogos del área han brindado, de manera gratuita, su esmerada
Como es de esperar, es muy emocionante ver su nombre impreso, especialmente la primera vez. Sin
embargo, una emoción aún mayor es el conocimiento de que puede haber agregado una pequeña cantidad a
nuestra comprensión de por qué las personas y los animales piensan y actúan como lo hacen.
ÿ RESUMEN
1. Cuando lea un informe de investigación, debe hacerlo de 3. También debe considerar estas preguntas cuando escriba
manera activa y crítica, para que pueda obtener el máximo su propio informe. El formato APA proporciona un marco
beneficio de la investigación de otras personas. para su informe, pero depende de usted escribir con
2. La lista de verificación para lectores críticos está diseñada claridad. Se proporcionan varias sugerencias que ayudan
para que adquiera el hábito de hacer preguntas a producir un estilo claro e inequívoco de redacción de
activamente sobre los informes que lee: ¿Qué hipótesis informes.
se están probando? ¿Cómo se están probando? ¿El 4. El capítulo concluye con una breve descripción del proceso
método prueba las hipótesis? ¿Los resultados se aplican de publicación. Para que la ciencia psicológica progrese,
a las hipótesis? ¿Cómo relaciona el autor los resultados los informes deben publicarse y los consumidores
con los propósitos de la investigación? ¿Qué informados deben leerlos críticamente.
interpretaciones e inferencias hace el autor?
ÿ TÉRMINOS CLAVE
resumen método
QUE formato Participantes
aparato procedimiento
autor referencias
diseño resultados
http://apa.org/science/lib.html
Puede encontrar una interesante revista en línea, Psycoloquy, patrocinada por la Asociación
Estadounidense de Psicología, en:
http://www.cogsci.ecs.soton.ac.uk/psycoloquy/
ÿ RECURSO DE LABORATORIO
Mientras que el Capítulo 10 del Manual de Laboratorio de Métodos de Investigación para Psicología
de Langston (2002) trata un tema diferente (detección de obstáculos por parte de los ciegos) que los
tratados en profundidad en este capítulo (factores que infl uyen en la votación y la memoria falsa de
palabras), el Los objetivos son los mismos: (a) desarrollar hipótesis, (b) probar entre hipótesis, (c) y
repetir el proceso hasta que haya precisado la respuesta.
PSICOLOGÍA EN ACCIÓN
Suponga que se interesa por los efectos de la hipnosis en la memoria. Muchas personas creen que
la hipnosis es una forma viable de recordar eventos que de otro modo no se recuperarían, pero
muchos tribunales no permiten que las personas que han sido hipnotizadas testifiquen como testigos.
¿Por qué es esto? ¿Nuestros recuerdos son susceptibles de cambiar cuando estamos bajo hipnosis?
¿O la hipnosis ayuda a la memoria? Estos son los tipos de preguntas que le interesan.
Para obtener respuestas a estas preguntas, realizará una búsqueda bibliográfica. Debido a que
usted no es un experto en esta área, no conoce los nombres de ningún investigador que haya
realizado trabajos sobre los efectos de la hipnosis en la memoria. Por lo tanto, el mejor lugar para
comenzar es probablemente PsycINFO. No es necesario ser bibliotecario o experto en informática
para utilizar bases de datos electrónicas como PsycINFO. Las pantallas de ayuda están disponibles,
así como las instrucciones impresas; además, el personal de referencia de su biblioteca puede
responder preguntas y ayudarlo a planificar su estrategia de búsqueda.
Para conocer los efectos de la hipnosis en la memoria, puede comenzar buscando una "palabra
clave"; para hacer esto, simplemente escriba una palabra que capte el tema que le interesa (por
ejemplo, hipnosis). Sin embargo, una búsqueda reciente arrojó 10.261 artículos de revistas escritos
sobre el tema de la hipnosis; Claramente, esto es demasiado para trabajar. Una búsqueda en la
memoria arroja aún más artículos: ¡84.630! En esta situación, querrá combinar palabras clave para
reducir los números. porque te interesa
PARTE 2
PRINCIPIOS Y
PRÁCTICAS DE
EXPERIMENTAL
PSICOLOGÍA
SEIS
Psicofísica
SIETE
Percepción
OCHO
Atención y tiempo de reacción
NUEVE
Condicionamiento y aprendizaje
DIEZ
Recordando y Olvidando
ONCE
Pensamiento y resolución de problemas
DOCE
Diferencias individuales y desarrollo
TRECE
Psicología Social
CATORCE
Psicología Ambiental
QUINCE
Factores humanos 151
CAPÍTULO 6
PSICOFÍSICA
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: LEY DE WEBER
153
Suponga que usted es dentista (o paciente de un dentista) y desea encontrar una manera de
hacer que el dolor sea más tolerable sin administrar medicamentos. La medición del dolor es un
problema psicofísico, ya que el grado de dolor debe inferirse del comportamiento del paciente en
el sillón del dentista. Este capítulo analiza varias técnicas psicofísicas sofisticadas para medir
sensaciones como el dolor.
Probablemente no se le ocurriría a usted, ni como dentista ni como paciente, que el olor
podría aumentar la tolerancia al dolor de una persona. Pero un estudio psicofísico reciente
(Prescott y Wilkie, 2007) demostró que un olor dulce puede hacer que el dolor sea más tolerable.
El dolor se estudió mediante la infame prueba del frío, que requiere que los sujetos sumerjan la
mano dominante y el antebrazo en agua fría (5 °C) durante un máximo de 4 minutos. Se les dijo
a los sujetos que dejaran la mano en el agua todo el tiempo que pudieran tolerar el dolor.
Los sujetos que respiraron un olor dulce mantuvieron su mano en el agua fría casi tres veces
más que los sujetos en una condición de control donde no había olor presente.
Por lo tanto, uno de los autores de este texto que debe someterse a un procedimiento dental de
endodoncia le lleva una copia del artículo de investigación a su dentista: otro ejemplo más de los
beneficios prácticos de la investigación psicofísica.
ÿ MEDICIÓN DE SENSACIONES
Este resultado inesperado se debe a varios factores, algunos de los cuales se abordan en este
capítulo. Examinaremos estos temas en el contexto de un área venerable de investigación en
psicología científica llamada psicofísica. La psicofísica involucra la determinación de la reacción
psicológica a los eventos que se encuentran a lo largo de una dimensión física. Edwin G. Boring
(1950), el eminente historiador de la psicología experimental, afirma que la introducción de
técnicas para medir la relación entre las impresiones internas (el psico de la psicofísica) y el
mundo externo (la física) marcó el inicio de la psicología científica.
Gustav Fechner formalizó los métodos psicofísicos, que miden los atributos del mundo en
términos de sus valores psicológicos (1860/1966). Sus métodos, que se detallan más adelante
en el capítulo, mostraron que los juicios psicológicos variaban de formas particulares según la
intensidad del estímulo y la modalidad sensorial particular de
el estímulo (es decir, los juicios de estímulos visuales diferían de los juicios de estímulos auditivos,
que diferían de los juicios de estímulos gustativos, y así sucesivamente). Dado que estas relaciones
se mantuvieron, al menos aproximadamente, para muchas personas diferentes, Fechner y otros
investigadores concluyeron que los juicios internos privados se habían medido con precisión. Como
se muestra en la figura 6.1, los psicofísicos podían medir los atributos psicológicos de brillo,
volumen, pesadez y dolor del mismo modo que los físicos midieron los atributos físicos
correspondientes de intensidad luminosa, intensidad auditiva, etc.
Tanto en la década de 1800 como en la actualidad, un uso destacado de la psicofísica es
medir sensaciones aparentemente simples como el brillo, lo que probablemente parezca innecesario.
Puede pensar que es sencillo decidir el volumen o el dolor de los estímulos. Sin embargo, resulta
que rara vez existe una relación directa de uno a uno entre los valores físicos y los valores
psicológicos. Si una banda de rock encendiera sus amplificadores para producir el doble de energía
de la que había producido antes (una duplicación de las unidades físicas), este doble aumento de
energía no daría como resultado que los oyentes experimentaran un sonido dos veces más fuerte
que antes. Para que un oyente juzgue que el sonido es el doble de fuerte, el nivel de energía tendría
que aumentar aproximadamente 10 veces. Tales descubrimientos derivados de los métodos
psicofísicos tienen importantes aplicaciones prácticas. Por ejemplo, el amplificador o el dial de la
radio que gira para aumentar el volumen (es decir, el volumen percibido) no puede soportar una
relación uno a uno entre los movimientos del dial y los aumentos de energía. Más bien, el dial debe
calibrarse para que sus movimientos aumenten la intensidad proporcionalmente a los incrementos
en el volumen. Por lo tanto, duplicar el nivel de volumen en el dial tiene que aumentar la energía
física unas 10 veces para producir un aumento del doble en el volumen. Los teléfonos también
están diseñados para que sus micrófonos y amplificadores funcionen de acuerdo con esta relación
psicofísica entre la intensidad auditiva y el volumen percibido.
La relación psicofísica entre estímulo y juicio depende de la modalidad sensorial particular que
se estimula. Los juicios de dolor en respuesta a los aumentos en la intensidad eléctrica de las
descargas aplicadas a la piel crecen mucho más rápidamente que los juicios de volumen en
respuesta a los aumentos en la energía del sonido. Para que una descarga se considere el doble
de dolorosa que otra, la intensidad de la descarga debe haber aumentado en aproximadamente un
tercio. Podemos ver, entonces, que la mera medición de cambios en unidades físicas no siempre
nos ayuda a determinar con precisión los cambios en unidades psicológicas.
En este capítulo, se utilizan métodos psicofísicos para ilustrar tres temas científicos.
Las defi niciones operativas describen los procedimientos utilizados para producir un concepto y
nos permiten comunicar con éxito los conceptos que estamos estudiando. ¿Qué significa cuando un
sujeto informa que detecta un estímulo doloroso? Una definición operativa de detección y otra de
dolor ayudarán a garantizar que los científicos utilicen términos técnicos de manera similar.
Un tema relacionado tiene que ver con las escalas de medida, la asignación de números o
nombres a los objetos y sus atributos. ¿Cómo determinamos si una intensidad de luz
La forma más común de proporcionar un significado técnico es mediante una definición operativa.
Una definición operativa es una fórmula para construir una construcción de tal manera que otros
científicos puedan duplicarla, especificando las operaciones utilizadas para producirla y medirla.
“Tomar el ojo de un tritón, la pata de una rana, tres conchas de ostra y agitar dos veces” es una defi
nición operativa, aunque no está del todo claro qué se está defi nindo. Sin embargo,
esta receta se puede duplicar, por lo que cumple con el criterio principal para una definición operativa.
Puede deducir de este ejemplo que una definición operativa no tiene que ser del todo sensata, siempre
que sea clara y se pueda copiar. Por ejemplo, podríamos definir operativamente una construcción
llamada centigramos como el producto de su altura en centímetros y su peso en gramos. Dado que
cualquier científico puede determinar fácilmente la puntuación en centigramos, esta es una definición
operativa válida. Por supuesto, probablemente no podría usarse para ningún propósito científico
importante, pero la utilidad potencial de una definición operativa es un tema aparte de su validez. Por
lo general, sin embargo, los constructos definidos operativamente están vinculados a una teoría o un
cuerpo de literatura de investigación, por lo que tienen sentido y cierta validez.
En las siguientes secciones, discutimos la definición operativa de una construcción teórica
llamada umbral. Primero, damos el significado del lenguaje común de este término; vemos entonces
cómo los intentos de aumentar la precisión de la definición han conducido a técnicas metodológicas
bastante sofisticadas para mejorar las definiciones operativas de un umbral.
ÿ TABLA 6.1
ÿ ÿ
200 Sí
180 Sí Sí
160 Sí Sí
140 Sí Sí Sí
120 Sí No No Sí
100 Sí No No
80 No No No
60 No No
40 No ÿ
20 No
ÿ
Significar
Nota: En la primera serie de ensayos, el experimentador comienza con un fuerte estímulo y disminuye su intensidad hasta
el observador ya no puede detectarlo. El umbral es la media de las intensidades de estímulo que producen el primer
respuesta “no” y la última respuesta “sí”. En la siguiente serie de ensayos, se aumenta la intensidad de un estímulo débil
hasta que se detecta. Se acostumbra comenzar cada serie con una intensidad de estímulo diferente para que sea menos probable que
las respuestas del observador estarán influenciadas por la longitud de una serie. Los estímulos están en unidades arbitrarias, es decir, el
las intensidades que van desde 20 a 200 podrían representar peso o cualquier otra cosa que pueda variar en intensidad.
La psicofísica clásica asume que el estímulo físico produce una distribución normal de eventos
mentales (Figura 6.2). Así, el valor mental real producido por el mismo estímulo físico varía de una prueba
a otra. El umbral es un concepto estadístico que corresponde a la media de esta distribución normal. Dado
que una distribución normal es simétrica, el umbral es el valor de estímulo que se puede detectar el 50 por
ciento del tiempo.
Frecuencia
mental
valor
del
Límite
Valor de estímulo
ÿ FIGURA 6.2
Ernst Heinrich Weber, cuyo trabajo pionero en psicofísica precedió al de Fechner en unos 20
años, descubrió algunas propiedades importantes del umbral de diferencia.
Una propiedad que determinó Weber fue que la magnitud del umbral de diferencia aumenta con
los aumentos en la magnitud del estímulo estándar. Encontró que 10 gramos es el umbral de
diferencia cuando 300 gramos es el estándar, y el valor correspondiente para un estímulo estándar
de 600 gramos es un umbral de diferencia de 20 gramos.
Un ejemplo familiar ilustrará este hallazgo psicofísico. En una habitación iluminada por un solo
ÿ TABLA 6.2
Comparación
Estímulo
(gramos) Respuesta
ÿ ÿ
350 más pesado
260 Encendedor
ÿ Significar
Nota: Para series descendentes, el umbral superior es la media de los estímulos que conducen a la última respuesta "más pesada" y la primera respuesta "igual".
El umbral inferior es la media de los estímulos que producen la última respuesta "igual" y la primera respuesta "más ligera". El estímulo estándar es siempre
300 gramos El umbral de diferencia es la mitad del intervalo de incertidumbre (10 gramos, en este ejemplo).
ÿ TABLA 6.3
ÿ
180 Sí
160 Sí
140 Sí Sí ÿ Sí
120 Sí No No ÿ
100 Sí No
80 No ÿ
Umbral 124
Pagos
Motivación
Vigilancia
Módulo sensorial Frecuencia
Sistemas sensoriales
en el cerebro
Evidencia
Valores X
Módulo de decisión
en el cerebro
Respuestas
ÿ FIGURA 6.3
Una mirada teórica a lo que sucede en la detección de señales. El análisis sensorial envía
valores de evidencia (X) al módulo de decisión. Los valores de X son una función de la intensidad
de la señal y la agudeza del observador. Los procesos de pagos, motivación y atención envían
información de sesgo de respuesta al módulo de decisión. Juntos, los componentes sensoriales
y de sesgo determinan la respuesta del observador. Los valores de evidencia X están en la
abscisa de las Figuras 6.4 y 6.5. Los pagos, etc., determinan la posición del criterio.
Los ensayos repetidos generan dos distribuciones, una solo para el ruido y otra para la señal más
el ruido, como se muestra en la Figura 6.4. Dado que las dos distribuciones se superponen en el medio,
algunos valores de evidencia son ambiguos, porque podrían haber ocurrido como resultado del ruido o
de la señal. Por supuesto, si las dos distribuciones estuvieran lo suficientemente separadas, este
problema se minimizaría, pero incluso en el laboratorio, la vida no suele ser tan sencilla.
Se debe establecer un criterio, que se muestra como una línea vertical en la figura 6.5, para
determinar si una respuesta será "sí" o "no". La posición de este criterio la establece el proceso de
decisión. Si los costos y los beneficios favorecen una política de decisión liberal, el criterio se establecerá
muy a la izquierda, por lo que la mayoría de las respuestas serán “sí”. Si se utiliza una política
conservadora, el criterio se mueve hacia la derecha, por lo que la mayoría de las respuestas serán “no”. E
criterio
Débil Fuerte
Magnitud de la evidencia
ÿ FIGURA 6.5
100
Liberal
d'
d'
Porcentaje
aciertos
de
50 Criterios de decisión
Conservador
0
0 50 100
Otra forma de manipular la tasa de aciertos y falsas alarmas es variar la frecuencia con la que se
produce la señal (consulte la Figura 6.10 más adelante). Si, durante una serie de intentos, se hubiera
producido una señal el 90 por ciento de las veces, sería más probable que dijera "sí" en cualquier intento
que cuando la señal se hubiera producido con muy poca frecuencia en los intentos anteriores.
A estas alturas, es posible que se pregunte qué tiene que ver todo esto con los umbrales. En ninguna
parte la curva ROC tiene una etiqueta que diga "umbral". Que un observador responda “sí” o “no” depende
de la evidencia y del criterio de decisión. La intensidad de la señal se puede mantener constante, pero dado
que hay pagos variables por aciertos y falsas alarmas, puede generar una curva ROC que muestre
d' (sensibilidad) y la pendiente de la curva en varios puntos. No existe una definición operativa de un umbral.
En su lugar, se definen operativamente dos cantidades. La sensibilidad del observador se denomina d' y se
define como la distancia entre las distribuciones de señal y ruido en la Figura 6.4 o como la distancia máxima
entre la curva ROC y la diagonal en la Figura 6.6. El criterio de los procesos de decisión se denomina beta
( ) y es la pendiente de la función ROC en el punto de interés, por ejemplo, una tasa de aciertos del 55 por
ciento.
Entonces, ¿qué es un umbral? Como se muestra en la figura 6.4, la teoría de detección de señales
supone que la evidencia de un estímulo es una distribución continua que toma un valor cero solo cuando la
intensidad del estímulo mismo es cero. No tenemos un umbral que divida la dimensión del estímulo en
componentes detectables e indetectables, como nos haría creer la psicofísica clásica. Más bien, un estímulo
debe producir una sensación que exceda el criterio de decisión ( ) para que una persona informe haber
detectado un estímulo débil (Figura 6.5). En cierto sentido, entonces, la noción de un umbral absoluto
determinado por un estímulo de una intensidad particular ha sido negada por la teoría de detección de
señales. Lo que nos queda, como sugiere D'Amato (1970), es un umbral de respuesta o decisión. Sólo
cuando un estímulo arroja evidencias que superan el umbral de decisión, lo que venimos llamando o el
criterio, tenemos detección correcta de la señal. Por supuesto, d' determina la detectabilidad de la señal,
pero no necesariamente lo que informa el sujeto.
Esto significa que la detección y el informe de la presencia de una señal están determinados por d' y ;
Juntas, estas dos cantidades determinan lo que un psicofísico clásico llamaría un umbral.
0 b
criterio
0.875
Área bajo la curva
d'
Cálculo de d'. Dado un conjunto de datos, podemos calcular fácilmente d' usando tablas
basadas en el área bajo la curva normal (ver Tabla A en el Apéndice C). Suponga que sabe
que la tasa de aciertos es 0,875 y la tasa de falsas alarmas es 0,21. ¿Qué es d'? Primero,
dibuje la distribución del ruido, como en la Figura 6.7. Dado que la tasa de falsas alarmas
representa el área bajo la curva desde el criterio hasta más infinito a la derecha, es igual a
0,21. Dado que la curva normal es simétrica, la mitad de su área (0,5) se encuentra entre cero y
Por lo tanto, el área entre cero y el criterio debe ser 0,52 0,21, que es igual a 0,29. Ahora
busque 0.29 en la Tabla A del Apéndice C. Encontrará que z = 0.8. Esta es la distancia
normalizada del criterio desde cero.
En segundo lugar, repita este proceso para la distribución de señales que se muestra en
la parte inferior de la Figura 6.7. Dado que la tasa de aciertos es 0,875, esta es el área bajo la
curva desde el criterio hasta más infinito. Nuevamente, debido a la simetría, la mitad del área
bajo la curva (0.5) está entre d' y más infinito. Por lo tanto, el área entre el criterio y d' es 0,875
0,5, lo que equivale a 0,375. Consultando la Tabla A del Apéndice C, encontramos que un
área de 0.375 corresponde a una z de alrededor de 1.15.
Ahora podemos poner estos dos valores z juntos para encontrar d' (Figura 6.8). Como a
la media de la distribución del ruido se le da el valor de cero, d' es la suma de los dos valores
de z : 0,8 1,15 1,95. Nuestro cálculo de d' ahora está completo. Obviamente, entonces, cuanto
mayor sea d', mayor será la distancia entre las medias de las dos distribuciones.
Por lo tanto, una d' grande indica una señal fuerte o un observador agudo.
Ventaja de los métodos de detección de señales. Una gran ventaja de los métodos de
detección de señales sobre un procedimiento psicofísico clásico, como el método de los
límites, es la capacidad de medir tanto la sensibilidad como el sesgo de respuesta. En muchas
áreas de la psicología aplicada, la capacidad de distinguir entre estos dos procesos es muy
importante. Volvamos al problema de medir la eficacia de los analgésicos.
En un gran número de experimentos, Hardy, Wolff y Goodell (1952) examinaron las
reacciones de las personas al calor radiante presentado en sus antebrazos por un equipo.
Ruido Señal
0 d'
0.8 1.15
ÿ FIGURA 6.8
Cálculo de d': la suma de los dos valores z da como resultado d'. d' = 0,8 + 1,15 = 1,95.
Es un dicho en psicofísica que todo lo que existe, ya sea la intensidad de los sentimientos
dolorosos o tu actitud hacia las espinacas, existe en alguna cantidad. Todo lo que existe en cierta
cantidad se puede medir. La medición es una forma sistemática de asignar números o nombres
a objetos y sus atributos. Cuando asignamos nombres o números a objetos y sus atributos,
necesitamos una escala de medición, que resulta de diferentes operaciones de medición. Cuando
medimos la temperatura, por ejemplo, generalmente usamos la escala Fahrenheit o la escala
centígrada. Estas dos escalas de temperatura son inapropiadas para medir el peso, que puede
medirse en libras o kilogramos.
Como veremos, las diferentes operaciones de medición producen escalas que difieren en la
información que proporcionan.
Este proceso se puede continuar para construir una escala psicológica. Una vez hecho esto,
existe una relación matemática fija entre el valor de la escala física correspondiente a algún punto
de la escala psicológica y el valor físico correspondiente al punto anterior de la escala psicológica
interna. Para encontrar el valor de la escala física que corresponde a un valor psicológico particular,
primero tomamos el valor físico del paso anterior en la escala externa (por ejemplo, X en la figura
6.9) y lo multiplicamos por la fracción de Weber. Luego sumamos este producto a nuestro valor
original, de modo que Y = X + el producto de X por la fracción de Weber en la figura 6.9 (del mismo
modo, Z = Y + el producto de Y por la fracción de Weber). Sumar de esta manera produce valores
físicos sucesivos que corresponden a JND sucesivos en la escala psicológica interna. Cuando esto
Absoluto
Thr es equipo
S
0 X Y DE
Ley de Fechner. Unidades iguales en una escala psicológica interna corresponden a unidades
progresivamente mayores en una escala física externa (los umbrales de diferencia): = K log (S).
SS Stevens (1961) intentó desarrollar una escala interna de sensación más directamente que Fechner.
Fechner utilizó un método de escalado indirecto , en el que la escala psicológica se construía poniendo
JND sucesivos en una fila. Los observadores no juzgaron las magnitudes de los JND directamente, por
lo que los valores de la escala psicológica se derivan de medidas de discriminación; por lo tanto, son
indirectos. Stevens usó varias técnicas de escalado directo , en las que el observador respondía en
unidades de escala psicológica en primer lugar.
Otra preocupación con la estimación de la magnitud se relaciona con las definiciones operativas.
Muchos estudios revelan que una escala sensorial particular, como el brillo, tiene más de una escala que la
caracteriza. Marks (1974) señala que puede describir con precisión una función de potencia para el brillo
solo si especifica todas las variables relevantes para la percepción del brillo: el color y la duración de la luz,
la adaptación sensorial del observador, etc. La variación de estos últimos factores cambia el valor del
exponente en la ley de Stevens. Por lo tanto, debemos definir operativamente la función psicofísica o
arriesgarnos a tergiversar la relación entre sensación y estímulo.
1.0
A B
observador 1 observador 1
probabilidades valores
Proporción
aciertos
de
.50 variable variable
0.85 0.85
.10
Gráficos ROC del mismo observador. En el panel (a) se varió la probabilidad de que ocurriera
una señal, y en el panel (b) variaron los pagos por aciertos y los costos de falsas alarmas.
El inserto muestra el ruido hipotético y las distribuciones de signo más ruido. Las curvas se
ajustaron a los puntos de datos de círculo abierto con d' 0,85. Observe el ajuste a los puntos de
datos y la similitud en la forma de las dos curvas. (Datos de Green and Swets, 1966.)
.0
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1.0
Proporción de falsas alarmas
Blough (1958, 1961) desarrolló una forma de hacer que la paloma indique la visibilidad de la luz.
Utiliza una variante del método de la escalera para determinar el umbral absoluto. Los picotazos en la
tecla Sí reducen gradualmente la intensidad de la luz y los picotazos en la tecla No la aumentan
gradualmente. Ocasionalmente, los picotazos en la tecla Sí apagan completamente la luz, y los
siguientes picotazos en la tecla No son recompensados con comida. Como señala Blough, este
procedimiento puede describirse antropomórficamente como si la paloma picoteara la tecla Sí para
apagar la luz y la tecla No para obtener la recompensa de comida. (Debe tener en cuenta que estas
luces nunca fueron lo suficientemente intensas como para ser aversivas para la paloma). Lo que
sucede es que cuando la luz es demasiado tenue para que la paloma la vea, cambia de la tecla Sí a
la tecla No para recibir el mensaje. premio. Cuando la luz es visible, cambia de la tecla No a la tecla
Sí para atenuar la luz.
Además, las dosis diminutas de LSD elevan el umbral absoluto de luz, tanto para las palomas como para
los humanos.
ÿ RESUMEN
1. Las definiciones operativas que especifican cómo se producen 7. En orden creciente de informatividad, las escalas de
y miden los conceptos son necesarias en la ciencia, tanto medición utilizadas en psicología son nominal, ordinal, de
para hacer que los experimentos sean más públicos como intervalo y de razón.
para aumentar la precisión de los términos técnicos más allá 8. La ley de Fechner probablemente produce una escala ordinal
de su uso en la conversación ordinaria. de juicios psicológicos. La ley de Stevens produce una
2. El método de los límites, ideado por Fechner, proporciona una escala de razón.
definición operativa de los conceptos de umbral absoluto y 9. La escala de magnitud etiquetada es una escala de 0 a 100
umbral diferencial. con etiquetas verbales para muchos números. La escala
3. La psicofísica clásica se dirige principalmente a la evaluación minimiza los efectos de techo y minimiza los rangos
de umbrales. La teoría más moderna de detección de idiosincrásicos de números usados por diferentes observadore
señales reemplaza el concepto de umbral con otros dos 10. Debido al estricto control y la relativa falta de complejidad del
conceptos definidos operativamente: d' y . comportamiento, muchos experimentos psicofísicos usan
4. Los procesos sensoriales se miden por d' y los procesos de diseños de n pequeña que emplean pocos sujetos. Los
decisión se miden por . Tanto d' como pueden calcularse a diseños de n pequeña también se utilizan debido a la
partir de funciones ROC (receiver-operating character istic) escasez de tipos especiales de observadores, como los
que trazan aciertos contra falsas alarmas. radiólogos.
5. Las escalas de medida resultan cuando se asignan 11. La capacidad de tomar decisiones de detección precisas se
sistemáticamente números o nombres a objetos oa sus puede mejorar mediante el uso de reglas de predicción
atributos. estadística que involucren variables predictoras e información
6. Las escalas de medición brindan información en la medida en de diagnóstico.
que miden diferencias, magnitudes e intervalos iguales y
tienen un punto cero verdadero.
ÿ TÉRMINOS CLAVE
ÿ PREGUNTAS DE DISCUSIÓN
1. Aunque es posible que el método de los límites no proporcione la el concepto de un umbral, ¿o son los dos métodos equivalentes
mejor definición de umbrales sensoriales, tiene muchos usos en lo que se refiere a la definición operativa?
prácticos, especialmente para la determinación de umbrales de
diferencia. Los efectos sensoriales de los aromatizantes 3. Calcule d' para los siguientes pares de tasas de aciertos y falsas
alimentarios suelen determinarse de esta manera. Vea si puede alarmas: (0,90, 0,10), (0,90, 0,25), (0,90, 0,50), (0,90, 0,90).
pensar en usos prácticos adicionales del método de los límites.
Una breve búsqueda bibliográfica en un 4. ¿Cuál es la diferencia entre una trilla absoluta
CONEXIONES WEB
Los escritos originales de Fechner se pueden encontrar en:
http://www.yorku.ca/dept/psych/classics/index.htm
PSICOLOGÍA EN ACCIÓN
Ley de Weber
Este proyecto examina la ley de Weber utilizando una variante del método de los límites para calcular el
umbral de diferencia para la pesadez. Para este proyecto, su aparato y materiales serán recipientes, algunas
pesas para colocar en los recipientes y una balanza. Los recipientes pueden ser vasos para beber, latas de
aluminio o cartones de leche. Puede usar monedas, arena o un material similar para el peso. Para pesar tus
materiales, una báscula postal o una báscula de cocina
CAPÍTULO 7
PERCEPCIÓN
PROBLEMAS DE PERCEPCIÓN
Percepción Directa e Indirecta
Conciencia y percepción
PRESENTACIÓN DE LAS VARIABLES
Variables dependientes
Variables independientes
Variables de control
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
RECURSO DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: EL EFECTO STROOP
Imagine que en realidad está viendo la ciudad de Ålesund, Noruega, desde el ángulo de la
cámara que produjo la Figura 7.1 en la página 182. En la forma estándar de conceptualizar el
proceso receptivo visual de tal escena, primero detecta la presencia de objetos; entonces, esta
sensación proporciona los elementos necesarios para tu percepción del pueblo. De acuerdo
con este enfoque, la percepción es la interpretación y el reconocimiento de los objetos y eventos
que percibimos. Esta sencilla e intuitivamente atractiva teoría de la percepción proporciona los
antecedentes para la mayoría de los problemas teóricos y metodológicos a los que se enfrentan
los psicólogos interesados en estudiar la percepción. (Para obtener detalles adicionales sobre
los problemas, consulte Coren, Ward y Enns, 1994).
ÿ PROBLEMAS DE PERCEPCIÓN
Un conjunto de problemas tiene que ver con la forma en que el observador usa la información
sensorial para hacer interpretaciones perceptivas. Observe de nuevo la figura 7.1. Si realmente
estuviera viendo Ålesund, percibiría las montañas más lejos que los edificios en primer plano.
Esta percepción natural e inequívoca es el resultado de varias señales que brindan información
sobre la distancia y la profundidad de los objetos en la escena. ¿Cómo entran en la percepción?
Kantowitz,
Barry
texto
1983
ojo
©de
ÿ FIGURA 7.1
para la visión nativista, la naturaleza del sistema visual (el ojo y el cerebro) determina la percepción
visual. Un ejemplo de un enfoque nativista de la percepción es la teoría de la Gestalt, que se
analiza en el Apéndice A.
En la psicología cognitiva contemporánea, la controversia directo/indirecto se describe a
menudo como un contraste entre el procesamiento perceptivo de abajo hacia arriba y de arriba
hacia abajo. La vista de abajo hacia arriba enfatiza el papel de los datos sensoriales en la
determinación de la percepción, y el enfoque de arriba hacia abajo enfatiza el papel de los
conceptos previamente establecidos en la determinación de las percepciones. Debido a estos
contrastes, también verá los dos aspectos de la percepción etiquetados como una distinción entre
el procesamiento basado en datos (el énfasis de abajo hacia arriba) y el procesamiento
basado en conceptos (el énfasis de arriba hacia abajo). Con respecto a la fotografía de Ålesund
(Figura 7.1), el análisis ascendente se centra en el gradiente de textura que parece retroceder en
la distancia hacia las montañas del fondo. Dado que esta textura que retrocede es un componente
de la profundidad y la distancia en nuestro mundo tridimensional, vemos directamente que la
imagen contiene profundidad. El enfoque indirecto o de arriba hacia abajo proporciona una
interpretación alternativa de su percepción de Ålesund. La interpretación desde la posición de
arriba hacia abajo afirma que su percepción de profundidad y distancia en una fotografía es una ilusión
Una ilusión es una percepción equivocada o distorsionada. ¿Por qué su percepción de estas
cualidades en la fotografía de Ålesund es una ilusión? Los pequeños edificios cerca de la parte
superior de la fotografía podrían ser edificios en miniatura, o podrían estar más lejos que los
grandes edificios en la parte inferior. Sin embargo, en la fotografía, ambos conjuntos de edificios
están a la misma distancia de usted (suponiendo que sus ojos y el plano de la imagen sean paralelos).
Sobre la base de su experiencia pasada con pequeños edificios distantes de usted, confiere
señales de profundidad ilusorias a la representación fotográfica bidimensional de Ålesund. Esta
interpretación de la profundidad conduce a una percepción tridimensional. Como no hay
profundidad real en la fotografía bidimensional, la profundidad y la distancia que
Conciencia y Percepción
Si el perceptor agrega significado e interpretación a las sensaciones, surge la pregunta de si estas
adiciones resultan de una deliberación consciente. El tema controvertido de la percepción que destacamos
en este capítulo se refiere al papel de la conciencia en la percepción. La esencia del problema de la
conciencia es esta pregunta: ¿Se pueden aplicar significados e interpretaciones a los datos de los sentidos
automáticamente, sin que seamos verbalmente conscientes de ellos, o es la conciencia verbal una parte
necesaria de la percepción? Von Helmholtz, recordará, argumentó que nuestras inferencias y conclusiones
son inconscientes.
Sin embargo, la percepción tiene que ver con la experiencia personal de un evento, y muchas
investigaciones sobre la percepción han intentado comprender la naturaleza de esta experiencia fenoménica
(Kaufman, 1974). Después de todo, continúa el argumento, si la percepción incluye una experiencia o un
sentimiento de “algo”, entonces debemos ser conscientes de ese “algo”. Se está llevando a cabo una
cantidad sustancial de investigación para determinar la relación entre la conciencia y la percepción. Como
era de esperar, el estudio de un proceso privado como la conciencia (ver Apéndice A) está plagado de
numerosos problemas metodológicos. Examinamos algunos de estos problemas en este capítulo. Para
preparar el escenario para nuestro examen, primero consideramos un estudio de caso neuropsicológico
notable, el paciente DB
Cuando DB tenía alrededor de 14 años, comenzó a experimentar violentos dolores de cabeza cada 6
semanas, acompañados de un óvalo temporal de ceguera en la parte izquierda de su campo visual.
Cuando tenía poco más de 20 años, los ataques aumentaron en frecuencia y una ceguera parcial
permaneció de forma permanente después de uno de los ataques de dolor de cabeza. Un angiograma,
que es una imagen de rayos X de la cabeza tomada después de inyectar una sustancia opaca en el torrente
sanguíneo, reveló una masa de vasos sanguíneos agrandados en la punta de la corteza visual en el lado
derecho del cerebro. Esta parte visual del cerebro y los vasos sanguíneos distorsionados se extirparon
quirúrgicamente. Inmediatamente, sus ataques de dolor de cabeza cesaron y DB pudo llevar una vida
razonablemente normal y productiva. Sin embargo, después de la operación, DB quedó ciego en la mitad
izquierda de su campo visual.
La razón por la que DB estaba ciego en la mitad izquierda de su campo visual se puede determinar a
partir de la figura 7.2. La corteza visual derecha contiene la información en el campo visual izquierdo,
Operación
y la corteza visual izquierda contiene la información en el campo visual derecho. Dado que a DB le
extirparon quirúrgicamente una gran parte de su corteza visual derecha para eliminar los dolores
de cabeza, el campo visual izquierdo no tenía la misma representación en el cerebro que el campo
visual derecho.
La ceguera de DB se determinó mediante un procedimiento llamado perimetría dinámica,
que es la forma estándar de evaluar los defectos del campo visual después de un accidente o una
cirugía. El procedimiento es una variante del método ascendente de ensayos de límites (ver Capítulo 6).
Con la cabeza del paciente inmóvil, se mueve lentamente un punto de luz a través del campo visual
de un ojo, comenzando en el perímetro. Cuando el paciente ve la luz, se la devuelve al perímetro y
se la lleva de nuevo a través del campo desde un ángulo diferente.
Este procedimiento se repite varias veces y da como resultado un mapa de áreas sensibles y
ciegas en el campo visual. Luego se repite la perimetría en el otro ojo. La parte ciega del campo
visual se llama escotoma; DB tenía un escotoma en la mitad izquierda del campo visual de cada
ojo.
Hasta ahora, esta ceguera, aunque desafortunada, era la esperada, dado que se había
extirpado tejido cerebral de la corteza visual derecha. Sin embargo, algunas observaciones
informales parecían mostrar que DB podía localizar objetos en su campo ciego. Por ejemplo, podía
alcanzar con precisión la mano extendida de una persona, aunque no pudiera verla.
Suponga que usted fuera Weiskrantz, el psicólogo que observó este extraño comportamiento.
¿Qué concluirías? Por un lado, DB estaba ciego. No informó haber visto estímulos en su campo
visual izquierdo. Por otro lado, el comportamiento de DB indicaba que podía detectar y localizar
estímulos en la misma zona. Weiskrantz y sus asociados creyeron en el informe verbal de DB de
que no podía ver objetos en su campo visual izquierdo, por lo que llevaron a cabo una serie de
experimentos controlados para determinar la capacidad visual del escotoma de DB.
Dado que DB no podía ver objetos en el campo ciego, se le pidió que hiciera conjeturas de
elección forzada sobre la ubicación y la presencia o ausencia de pequeños parches de luz. Otras
pruebas requerían que adivinara la orientación de líneas muy pequeñas. Todas las pruebas se
realizaron en condiciones de iluminación controlada y la cabeza y la dirección de la mirada de DB
se mantuvieron fijas. A veces, los estímulos visuales se presentaban tan brevemente en el área
ciega que DB no podía mover los ojos lo suficientemente rápido como para cambiar su enfoque
hacia el buen campo visual. Los estímulos de líneas y puntos eran pequeños y no muy intensos,
pero su tamaño e intensidad pueden haber infl uido tanto en los buenos como en los malos campos
visuales simultáneamente. Por lo tanto, la detección de estos objetivos en el campo visual ciego se
comparó con la detección en el campo bueno y en el punto ciego.
Todo el mundo tiene un punto ciego en cada ojo. Es la parte de la retina donde los nervios
salen del globo ocular y por lo tanto es insensible a la luz. Si DB pudiera detectar un objetivo en su
punto ciego, significaría que el objetivo era tan intenso o tan grande que se "filtró" a áreas sensibles
del ojo. Dado que el punto ciego era mucho más pequeño que el campo de ceguera de DB y dado
que no podía detectar objetivos en su punto ciego, Weiskrantz había elegido estímulos objetivo con
características apropiadas para probar en el campo ciego.
Weiskrantz luego le presentó a DB puntos y líneas de orientación horizontal o vertical. Los
resultados de las pruebas controladas fueron muy interesantes. La localización, detección y
adivinación de la orientación de los objetivos presentados al campo ciego fueron mucho mejores de
lo que podría esperarse por casualidad. En muchos casos, el rendimiento visual del campo ciego
fue casi tan bueno como el del campo visual bueno. D.
B. no pudo identificar los objetos presentados a su campo ciego, y durante la prueba afirmó no ver
los objetivos para los que se le pidió que hiciera juicios de elección forzada. La reacción de DB a su
éxito en las pruebas de elección forzada fue de incredulidad. Atribuyó su éxito a conjeturas
afortunadas, porque simplemente no podía ver los estímulos objetivo.
Blindsight es el nombre que Weiskrantz usó para describir la capacidad visual en un escotoma
(el campo ciego) cuando no hay una conciencia reconocida de percepción. Esto parece un fenómeno
muy extraño, pero Weiskrantz y sus asociados (p. ej., Weiskrantz, 1997; Weiskrantz, Cowey y
LeMare, 1998) informan sobre otro paciente con visión ciega, GY, similar en etiología y
comportamiento a DB. Además, la generalidad de la disociación entre la conciencia verbal y la
capacidad de percepción no son el problema, porque otros estudios neuropsicológicos han
demostrado que diferentes tipos de daño cerebral pueden provocar trastornos similares a la vista
ciega. Por ejemplo, Paillard y asociados (1983) informan del caso de una mujer con lesión cerebral
que no era sensible al tacto en el lado derecho de su cuerpo; sin embargo, cuando se le pidió que
localizara dónde había sido tocada en su lado insensible, pudo hacerlo con considerable precisión.
ella también podría
patrones o líneas. Muchos de estos estudios intentan objetos relacionados con la comida con más frecuencia que
determinar si la percepción se aprende como cualquier otra las personas que han comido recientemente. Aunque estos
conducta o si es innata. En un momento, la distinción entre fenómenos son interesantes por derecho propio, cuando nos
percepción innata y aprendida fue una gran controversia en enfocamos en el estímulo como el determinante más
psicología. Ahora, como se señaló anteriormente, la mayoría importante de la percepción, estos otros efectos se convierten
de los psicólogos admiten que hay componentes innatos y en artefactos y deben ser controlados. En términos de la
aprendidos en la percepción. teoría de la detección de señales (ver Capítulo 6), los aspectos
de decisión de la percepción deben mantenerse constantes.
Informar sobre una palabra tabú requiere una mayor duración
Variables de control de la visualización no porque la palabra sea más difícil de
percibir, sino porque los observadores son más reacios a
Este capítulo se ocupa de lo que podría denominarse los decir una palabra tabú al experimentador y, por lo tanto,
aspectos intelectuales de la percepción; sin embargo, la alterar su criterio de decisión (Zajonc, 1962).
percepción tiene aspectos emocionales y motivacionales, que
también discutiremos. También se deben controlar los aspectos físicos del
Por lo tanto, cuando se les pide a las personas que informen estímulo que no se están investigando.
sobre palabras tabú de cuatro letras, estas palabras requieren Las características más importantes que deben mantenerse
una mayor duración de visualización que las palabras de constantes cuando no son variables independientes incluyen
control inocentes. De manera similar, cuando las personas la duración del estímulo, la intensidad, la iluminación, el
contraste y similares.
hambrientas observan una imagen desenfocada, informan haber visto
¿Cómo sabe el psicólogo cuándo la respuesta del observador califica como una variable
dependiente útil? La respuesta es engañosamente simple: califica solo cuando se puede inferir
directamente una relación verificable entre la respuesta y un evento perceptivo anterior. Natsoulas
(1967) definió un informe como una relación supuesta o confirmada entre algún evento precedente o
sincrónico (ei) y la respuesta. Esta relación debe ser tal que haga posible inferencias directas a partir
del conocimiento de la respuesta a ei (p. 250).
Esta definición es deliberadamente abstracta y tendrá más sentido una vez que hayamos
examinado otro ejemplo concreto.
En el capítulo anterior, discutimos cómo se podría entrenar a una paloma para que nos diga su
umbral visual absoluto (Blough, 1958). Recordarás que la paloma picoteó una tecla cuando vio el
estímulo y otra tecla cuando no lo vio. Las contingencias de refuerzo apropiadas aseguraron que el
comportamiento de la paloma fuera controlado por el estímulo. De acuerdo con la definición que
acabamos de dar, ¿las respuestas de picoteo de la paloma califican como informes?
En este caso, el evento precedente (ei) es el estímulo, con particular referencia a su intensidad.
Un picotazo en una tecla indica que el estímulo está por debajo del umbral,
Ahora podemos considerar el caso de DB de una manera ligeramente diferente. Sus dos
clases de informes perceptuales, el verbal y el de detección/localización, están en conflicto. La
dificultad para comprender este conflicto surge por dos razones. Primero, los humanos tienden a
poner mucho énfasis en los informes verbales como indicadores de la experiencia fenomenológica.
Así, el informe verbal debe ser el “correcto”, a pesar de los casos de la mujer demente y las
palomas de Blough. En segundo lugar, la gente supone incorrectamente que todos los informes
perceptivos tendrán el mismo evento sincrónico precedente. Es lógicamente posible (y
empíricamente probable, como pronto descubriremos) que la ei de un informe verbal sea diferente
de la ei asociada con otros indicadores de la experiencia perceptiva. Un informe puede indicar
una experiencia perceptual y otro puede no hacerlo.
DB tuvo efectos secundarios conscientes a las percepciones no conscientes de los estímulos externos.
Las imágenes posteriores fueron confiables y se comportaron de manera legal, por lo que pueden considerarse
eventos sincrónicos (Natsoulas, 1967). Weiskrantz llama a las inusuales imágenes secundarias de DB vista
principal para distinguirlas de la vista ciega. Ambas "visiones" pueden forzar la credulidad, pero son
percepciones de acuerdo con nuestro análisis de eventos sincrónicos.
¿Son estas meras curiosidades de la percepción con poca relevancia para la percepción "real"?
No lo creemos, porque ahora examinaremos cómo se puede estudiar la percepción sin conciencia verbal en
participantes de investigación ordinarios. Lo que debe hacerse es determinar los indicadores de la experiencia
perceptual en ausencia de informes verbales de esa experiencia.
En la prueba de preparación de Stroop, Marcel empleó una técnica inteligente para manipular la conciencia
de los observadores sobre la palabra de preparación. Impidió la percepción de la palabra primaria en algunos
ensayos mediante un procedimiento llamado enmascaramiento. El enmascaramiento, en este contexto, implica
El procedimiento de Marcel para parte de uno de sus experimentos se describe en la figura 7.3. Para
presentar los estímulos utilizó un taquistoscopio, que es un aparato que permite presentaciones muy
breves. El tiempo entre el inicio y el parche de color fue de 400 ms, que son cuatro décimas de segundo.
La conciencia del primigenio se determinó por cuánto tiempo después la máscara siguió al primigenio. En
pruebas conscientes, la máscara se presentó al mismo tiempo que el parche de color (400 ms después
de la preparación). Este intervalo es lo suficientemente largo para que se detecte e identifique el primo.
En los ensayos desprevenidos, el intervalo entre el inicio de la máscara y el inicio del inicio fue muy
corto. Antes del inicio de la prueba Stroop, el intervalo exacto
1. Primera palabra
ROJO
(rojo, verde, amarillo o azul)
LBZSF
400ms VMQHK 2. Máscara
JTACP
3. Parche de color
(rojo, verde, amarillo o azul)
Una ilustración del procedimiento de Marcel (1983) (parte de su experimento 3). Apareció un
parche de color (rojo, verde, amarillo o azul) 400 ms después de una palabra principal (sin palabra,
rojo, verde, amarillo, azul o una palabra sin color). La máscara en los ensayos conscientes se
produjo con el parche de color. En pruebas inconscientes, la máscara se presentó justo después de
la primera. El tiempo entre el inicio del inicio y el inicio de la máscara en los ensayos inconscientes
se determinó por separado para cada sujeto, de modo que el sujeto pudiera determinar la presencia
del inicio no más del 60 por ciento del tiempo (la probabilidad de detección habría sido del 50 por
ciento: "sí" o “no” el primo estaba presente). Cuando aparecía el parche de color, el sujeto indicaba
el color presionando un botón correspondiente a rojo, verde, amarillo o azul.
Los resultados fueron sencillos. Tanto en los ensayos conscientes como inconscientes, se obtuvo
un efecto Stroop típico. En comparación con los números primos neutros y sin ningún tipo de primo, la
identificación del color (por ejemplo, amarillo) fue más lenta después de números primos incongruentes
(por ejemplo, la palabra azul) y más rápida después de números primos congruentes (amarillo),
independientemente de si los sujetos eran conscientes de ello. los primos Con base en estos resultados
y los resultados de otros experimentos que realizó, Marcel concluyó que las personas pueden percibir
el significado sin ser conscientes.
En el experimento de Marcel, el comportamiento de los observadores en la prueba de Stroop
mostró que se había registrado el significado, aunque sus informes verbales indicaban que no se habían
percibido los estímulos primarios. Cheesman y Merikle (1984) cuestionaron la interpretación consciente
de los resultados. Señalaron que el umbral de detección de Marcel del 60 por ciento permitió la
posibilidad de una detección verdadera en algunos ensayos (consulte el Capítulo 6 sobre la distribución
de la respuesta en la detección de señales). Además, Cheesman y Merikle razonaron que los informes
verbales de conciencia pueden tener un umbral más alto que la respuesta diferencial al significado de
las palabras. Si este es el caso, entonces quizás Marcel haya determinado inadvertidamente el umbral
incorrecto cuando ajustó el intervalo de máscara principal para obtener menos del 60 por ciento de
detección. El procedimiento de Marcel puede haber resultado en un umbral que estaba por debajo del
umbral de los observadores para hacer un informe verbal pero por encima de su umbral de detección.
Primer/parche congruente
(la palabra rojo y un parche rojo)
Primer/parche incongruente
(la palabra verde y un parche rojo)
+ 100
+ 80
+ 60 base
línea
lento
Más
que
de
la
+ 40
+ 20
reacción
Cambio
relativo
tiempo
de
en
el
- 20
- 40 rápido
base
línea
Más
que
de
la
- 60
- 80
-100
25% 55% 90% No
Mascarilla
Nivel de detección principal
Condición
ÿ FIGURA 7.4
Resultados de Cheesman y Merikle (1984), que muestran los tiempos de reacción de los primos
congruentes e incongruentes en relación con los primos neutros en cada una de las cuatro condiciones.
El efecto Stroop se ve en todas las condiciones excepto en la condición de detección principal del 25 por ciento.
Para probar esta teoría directamente, Cheesman y Merikle (1984) realizaron un segundo
experimento en el que variaron la intensidad (nivel de energía) del cebador para determinar los dos
umbrales. En el umbral objetivo, los observadores detectaron al azar y verbalmente desconocían las
palabras. En el umbral subjetivo, los observadores detectaron las palabras el 66 por ciento de las veces,
pero afirmaron no poder identificarlas. Luego se repitió la prueba de Stroop y se encontró el efecto de
Stroop para primos presentados en el umbral subjetivo, pero no para primos presentados en el umbral
objetivo.
La teoría de los dos umbrales se ilustra en la figura 7.5. Entre los dos umbrales, las personas
hacen informes verbales de que no son conscientes de los números primos, pero sus respuestas a los
estímulos indican que son sensibles al significado. Por debajo del umbral objetivo, la conciencia no se
puede determinar, porque los sujetos responden en un nivel de oportunidad y son verbalmente
inconscientes. De acuerdo con esta forma de ver el efecto Stroop enmascarado-primo, Marcel había
determinado en sus experimentos el umbral subjetivo, no objetivo.
La teoría derivada del trabajo de Cheesman y Merikle tiene algunas implicaciones importantes para
comprender el papel de los informes verbales en la investigación perceptiva. En primer lugar, se ha
proporcionado una forma coherente de pensar sobre la diferencia entre los informes verbales que se
cree que indican conciencia y otras respuestas perceptivas. Para sujetos normales, ahora tenemos
formas de determinar cuándo deben ocurrir tales discrepancias, y para pacientes como DB, ahora
tenemos una forma sensata de pensar sobre un comportamiento aparentemente extraño. Weiskrantz
informa que estímulos muy fuertes presentados al campo ciego de DB produjeron algunos sentimientos
de conciencia, pero no de visión ordinaria.
Podemos concluir que una consecuencia del daño a la parte visual del cerebro es una marcada elevación
del umbral subjetivo (como se indica más adelante, también hay factores adicionales).
Una segunda implicación de la teoría de los dos umbrales es que no hay necesariamente nada
especial en un informe verbal. En cada nivel de umbral en la investigación de Cheesman y Merikle, el
informe verbal proporcionó poca información más allá de la proporcionada por las respuestas
discriminatorias de elección forzada. Esto sugiere que tales índices de percepción son perfectamente
adecuados, y que la prima que la gente otorga a la veracidad y la necesidad de los informes verbales de
conciencia puede estar fuera de lugar. En muchos casos, todo eso
UMBRAL OBJETIVO
Imposible de Determinar
Nivel de conciencia
nivel de probabilidad de respuesta
al significado; no
verbalmente consciente del significado
DÉBIL
se necesita para entender que una percepción es un indicador de respuesta; las declaraciones de conciencia
no son esenciales.
Sin embargo, se mantiene el fuerte componente fenomenológico de la percepción, y las personas son
conscientes de unas cosas y de otras no. El umbral de la conciencia no puede ser el umbral objetivo.
Entonces Cheesman y Merikle (1986) concluyen:
Cheesman y Merikle han ofrecido una definición operativa de conciencia (véanse las discusiones
sobre definiciones operativas en los Capítulos 6 y 12). La simple definición de conciencia no nos permite
distinguir los procesos conscientes de los inconscientes y determinar la validez de un informe verbal. A
primera vista, Cheesman y Merikle simplemente permiten que cada sujeto utilice su propia confianza
subjetiva para establecer el umbral de conciencia. Señalan que este es un problema serio, porque la
confianza subjetiva no se puede distinguir del sesgo de respuesta. Si solo tenemos el umbral subjetivo
como medida del umbral de conciencia, entonces estamos casi de vuelta donde comenzamos: tenemos un
informe no verificable. Para resolver este problema adecuadamente, necesitamos usar operaciones
convergentes, un tema al que nos dirigimos ahora.
Garner y asociados señalaron que esto era solo una parte del operacionismo. Igualmente importante
fue la necesidad de un conjunto de operaciones para defi nir cada concepto. Citaron al físico Bridgman
(1945) para enfatizar este aspecto descuidado:
Definición operativa de la percepción como una respuesta de discriminación, es decir, una respuesta
de A o B—no es suficiente. Se requieren al menos dos operaciones.
Cuando se utiliza una sola operación, es imposible distinguir entre las limitaciones del sistema de
percepción y las del sistema de respuesta. Dado que los sistemas de percepción y de respuesta son hasta
cierto punto independientes, se requieren dos o más operaciones para separar las limitaciones de cada
sistema.
Las operaciones convergentes son un conjunto de dos o más operaciones que eliminan conceptos
alternativos que podrían explicar un conjunto de resultados experimentales. Esta definición abstracta se
comprende mejor a través de varios ejemplos. Comenzamos con una discusión del trabajo adicional
realizado por Cheesman y Merikle.
incongruente
primos
+ 100
+ 80
+ 40
incongruente
primos
+ 20
reacción
relativo
Tiempo
de
la
a neutra
base
(ms)
línea
de
- 20
Congruente
- 40 primos
Congruente
- 60 primos
- 80
33 66 33 66
Resultados de Cheesman y Merikle (1986), que muestran una mejora del efecto Stroop para primos por
encima del umbral subjetivo cuando aumenta la frecuencia de pruebas congruentes.
La magnitud del efecto Stroop para números primos inconscientes no está influenciada por la frecuencia de
los ensayos congruentes.
Weiskrantz presentó una x o un triángulo en la periferia del campo bueno; para presentaciones breves y
tenues, la detección allí fue más pobre que la detección en la parte central del campo ciego. A pesar de la mala
detección en el buen campo, DB aún podía decir si se había presentado una x o un triángulo en estos ensayos.
Al igual que en otros experimentos, la detección precisa en campo ciego estuvo acompañada de ceguera para
la identificación de los estímulos. Es decir, DB podía decir cuándo se presentaron los objetivos al campo ciego,
pero no pudo decir si habían sido una x o un triángulo. A partir de sus experimentos con DB, Weiskrantz concluyó
que la disociación es consistente con la idea de que hay dos sistemas visuales. Como se mencionó anteriormente,
uno es un sistema de “qué” que se refiere a la identificación y el reconocimiento. El otro es un sistema de “dónde”
que se ocupa de la detección y la localización. En ausencia de daño cerebral, estos sistemas funcionan juntos,
de modo que la detección va acompañada del reconocimiento y, en humanos adultos, de la conciencia verbal.
Otros tipos de investigación indican una doble disociación entre los sistemas visuales qué y dónde. La
investigación fisiológica (Cowey, 1995) ha demostrado disociaciones en monos cuando partes de sus sistemas
visuales han sido alteradas quirúrgicamente. Las lesiones en una parte del sistema visual provocan un
reconocimiento desordenado de lo que hay allí, pero la localización está intacta; las lesiones en otras partes del
sistema visual dan como resultado una ausencia de capacidad espacial, pero el reconocimiento de objetos está
intacto. Tipos similares de resultados han sido reportados en la literatura neuropsicológica. Farah (1990) analiza
dos tipos diferentes de personas con daño cerebral.
Con daño en una parte de su sistema visual, las personas no pueden ver ni imaginar objetos, pero pueden
descubrir e imaginar dónde se encuentran los objetos. Por el contrario, las personas con daños en otras áreas
del cerebro pueden ubicar objetos e imaginar su ubicación, pero estas personas no pueden reconocer o imaginar
los objetos en sí mismos. Entonces, dos combinaciones adicionales de resultados proporcionan más evidencia
convergente de un sistema visual compuesto por dos sistemas funcionales. Los datos conductuales, fisiológicos
y neuropsicológicos dan como resultado un patrón impresionante de evidencia convergente, que respalda
firmemente la teoría de Norman (2002) de que tanto los procesos directos como los indirectos están involucrados
en la visión normal.
Es bien conocido en las artes visuales que los colores cálidos (amarillo, naranja, rojo y las
transiciones entre estos colores) dan la apariencia de moverse hacia el espectador, mientras que
los colores fríos (azul, verde) parecen alejarse del espectador.
Se puede hacer que una imagen bidimensional parezca tridimensional mediante recursos artísticos
tales como fondos azules y primeros planos de colores cálidos.
Esta ilusión puede ser bastante convincente. Uno de nosotros recuerda haber visto una exposición
de vitrales en la que una obra de arte tenía varios paneles de vidrio de color azul oscuro que
rodeaban un círculo rojo. La ilusión de las tres dimensiones era tan fuerte que el círculo parecía
flotar unos 10 centímetros frente al fondo azul. El autor tuvo que subir y tocar el vidrio para
convencerse de que los pedazos de vidrio rojo y azul estaban en el mismo plano. Imagine que un
psicólogo experimental desea investigar esta ilusión de colores cálidos y fríos.
Problema ¿Por qué los colores cálidos parecen avanzar y los colores fríos
retroceder?
Antes de intentar responder a esta pregunta en detalle, un psicólogo experimental cuidadoso
primero intentaría demostrar el fenómeno en circunstancias controladas de laboratorio. Él o ella
querría descartar la posibilidad de que la ilusión ocurra debido a otros recursos artísticos, como la
perspectiva o las variaciones en el brillo, los cuales pueden crear una apariencia de distancia.
Por lo tanto, primero se presentaría una hipótesis general de que el color sirve como señal de
profundidad. Como siempre es cierto, podemos formular varias versiones comprobables más
específicas de esta hipótesis general.
Las variables independientes y de control son como antes. La variable dependiente es ahora
la distancia entre el observador y el estímulo ajustable.
Sin embargo, al anotar esta distancia, probablemente tomaríamos la posición del estímulo fijo
como cero y registraríamos un número negativo si el estímulo ajustable está más cerca del
espectador y un número positivo si está más lejos.
Mientras que el primer experimento arrojó una evaluación cualitativa de la cálida-
genial ilusión, este experimento da un número basado en la distancia percibida.
Por lo tanto, proporciona una indicación de cuán fuerte o débil puede ser la ilusión para
diferentes combinaciones de colores. Si fuéramos lo suficientemente audaces, esta hipótesis
podría concretarse aún más prediciendo que el tamaño de la ilusión dependería de la diferencia
de frecuencia entre los matices de cada par de estímulos. A medida que los estímulos estuvieran
más separados en el espectro visual, se obtendrían ajustes de mayor distancia.
Hasta ahora, nuestros dos experimentos se han dirigido más a establecer la replicabilidad y
confiabilidad del hallazgo (hipotético) de que los colores cálidos avanzan y los colores fríos
retroceden que a explicar por qué sucede esto.
Las operaciones convergentes proporcionadas por los dos experimentos son débiles, ya que son
bastante similares y difieren solo en la precisión con la que se mide la variable dependiente. En
particular, los juicios realizados por el espectador son juicios relativos relativos a dos colores
vistos simultáneamente. El próximo paso para explicar nuestro resultado (hipotético) sería
proporcionar una operación convergente más fuerte al requerir un juicio absoluto sobre un solo
estímulo.
ÿ RESUMEN
1. La percepción a menudo se describe como la interpretación de 3. En el efecto Stroop, el trabajo de Cheesman y Merikle indica
la sensación. Los problemas en el estudio de la percepción que existe una diferencia en la conciencia verbal para los
incluyen el papel de los enfoques directos e indirectos de la elementos que se presentan por encima de un umbral subjetivo
percepción (a menudo denominados procesos de abajo hacia y para los que se presentan por debajo del umbral subjetivo y
arriba y de arriba hacia abajo), las formas en que los factores por encima del umbral objetivo.
nativos y experienciales influyen en la percepción, y el papel
que desempeña la conciencia. 4. Las operaciones convergentes permiten inferencias sobre
2. Los informes verbales permiten al psicólogo estudiar las operaciones perceptuales que son más fuertes que las
experiencias perceptivas y fenomenológicas de otra persona. inferencias de un solo experimento o condición experimental.
Sin embargo, se necesita cuidado para asegurarse de que los Las operaciones convergentes han permitido a los psicólogos
informes verbales sean variables dependientes adecuadas. comprender mejor la visión ciega, la percepción sin conciencia
Ejemplos de problemas de percepción que han sido estudiados y la percepción con conciencia explícita.
mediante informes verbales son la visión ciega y la percepción
sin conciencia.
ÿ PREGUNTAS DE DISCUSIÓN
1. Si alguna vez ha tomado medicamentos recetados para 3. Diseña tu propio experimento para investigar más a fondo
aliviar el dolor quirúrgico o dental, es posible que haya la ilusión de distancia de color cálido-frío.
experimentado una disociación entre la sensación o el 4. Consulte un texto de percepción (como el de Coren et al.,
dolor (el dolor) y su capacidad para localizar la fuente del 1994) y discuta ejemplos adicionales de ilusiones e
informes fenomenológicos.
dolor. Relacione esto con la vista ciega y la percepción sin conciencia.
2. Consulte a Garner (1974) y discuta cómo se usan las
operaciones convergentes para reforzar los conceptos de
integralidad dimensional y separabilidad.
CONEXIONES WEB
ÿ RECURSO DE LABORATORIO
En el Capítulo 6 del manual de Langston (2002) se considera un experimento interesante sobre la percepción.
Este experimento examina cómo el color de la habitación influye en el estado de ánimo de una persona.
El efecto Stroop
Puedes probar fácilmente la prueba de Stroop por ti mismo. Todo lo que necesita son algunas
fichas, marcadores de colores y un reloj con segundero o, mejor aún, un cronómetro.
Tome dieciséis fichas y, usando sus marcadores, escriba el nombre del color en su color,
es decir, con un marcador verde, escriba VERDE, y así sucesivamente. Si tiene ocho marcadores,
cada color se repetirá dos veces. Si solo tiene cuatro marcadores, repita cada color cuatro veces.
Tome otras dieciséis fichas y escriba nombres de colores que no correspondan con la tinta, es
decir, con un marcador verde, escriba ROJO, y así sucesivamente. Tus estímulos ahora están
completos.
Elige uno de los dos mazos; para cada tarjeta, nombre el color de la tinta. Calcule el tiempo
que le toma pasar por las dieciséis cartas. Haz lo mismo con el otro mazo. ¿Fuiste más rápido
con la plataforma que tenía nombres de colores y tintas compatibles? Sería mejor probar a varias
personas para obtener resultados más confiables que solo probarse uno mismo.
Otra forma de estudiar el efecto Stroop es usar estímulos numéricos. Determine qué tan
rápido sus participantes pueden leer una columna larga de un solo dígito en la que los números
del 1 al 4 se repiten varias veces. Luego determine cuánto tiempo les toma contar el número de
símbolos arbitrarios en una columna. La columna debe ser tan larga como la primera, y debe
usar un símbolo como un signo de dólar de tal manera que haya uno, dos, tres o cuatro de ellos
en una línea. Ahora, está listo para probar la condición de conflicto de Stroop. Elabora una
columna tan larga como las dos anteriores en la que tengas estímulos como 2 2 2 2, 1 1, 3 y 4 4
4. La tarea de los participantes es nombrar el número de dígitos; es decir, deben decir “cuatro”
cuando vean 2 2 2 2, y así sucesivamente.
Una adición interesante a cualquiera de los experimentos anteriores sería que un grupo separado
de participantes leyera todos los estímulos cuando las listas se presentan al revés.
Esto dificultará la lectura y el conteo y disminuirá la velocidad de respuesta.
CAPÍTULO 8
ATENCIÓN Y
TIEMPO DE REACCIÓN
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: VELOCIDAD-EXACTITUD
COMPENSACIÓN
207
En este capítulo, examinamos dos procesos cognitivos básicos: la atención y el tiempo necesario
para responder a los estímulos. Nos centramos en los aspectos de la atención relacionados con cómo
las personas cambian sus recursos cognitivos de una tarea a otra. Con respecto al segundo tema,
consideramos tanto el comportamiento manifiesto (el tiempo de reacción para responder) como la
naturaleza y el momento de las ondas cerebrales que ocurren durante la actividad cognitiva. Las
cuestiones metodológicas examinadas son la confusión, la selección de la variable dependiente y las interac
El interés por el tiempo de reacción comenzó en el siglo XVIII, cuando un asistente del Observatorio
Real de Inglaterra fue despedido porque sus tiempos de reacción no concordaban con los tiempos de
reacción de su empleador. Los astrónomos de aquellos días registraban la hora y la posición de los
eventos astrales al observar cuando un cuerpo celeste cruzaba una línea en el ocular de su telescopio.
Un reloj cercano marcaba cada segundo, y se esperaba que el observador anotara el tiempo de cruce
con una precisión de décima de segundo. Cuando los tiempos de cruce de Kinnebrook, el desafortunado
asistente, eran revisados por su jefe, siempre eran demasiado largos. Kinnebrook fue advertido pero
no pudo acortar sus tiempos de observación, por lo que fue despedido.
Un astrónomo alemán, Bessel, se enteró del disparo de Kinnebrook y se preguntó si la diferencia
entre los tiempos de cruce de Kinnebrook y su jefe se debía a algo más que a la incompetencia. Bessel
sospechó que las personas podrían observar el cruce con tiempos de reacción ligeramente diferentes.
Cuando Bessel y otros astrónomos compararon sus tiempos de cruce, encontraron diferencias
sistemáticas consistentemente. Algunos astrónomos siempre hicieron estimaciones más rápidas que
otros. Esta diferencia entre los astrónomos al reaccionar a los tiempos de cruce de los cuerpos celestes
se denominó ecuación personal, un nombre que destaca el hecho de que las personas difieren en
sus tiempos de reacción y, por lo tanto, tienen su propia ecuación para estimar los tiempos de cruce.
La ecuación personal siguió siendo solo un problema para los astrónomos hasta que Donders, un
fisiólogo holandés, se dio cuenta de que podía usar los tiempos de reacción de las personas para
calibrar el tiempo requerido para varias operaciones mentales. Donders desarrolló tres tipos de tareas
de tiempo de reacción que todavía se conocen como reacciones de Donders A, B y C (ilustradas en la
figura 8.1).
En la reacción A, que a menudo se denomina reacción simple , se enciende un solo estímulo,
por ejemplo, una luz, y el observador responde presionando rápidamente una tecla o un botón.
Sólo hay un estímulo y una respuesta. Cuando apaga su despertador en respuesta a su fuerte señal,
el tiempo entre el inicio del sonido y la pulsación del botón de alarma es su tiempo de reacción simple.
Donders creía que la reacción A, o simple, proporcionaba una línea de base de las operaciones
cognitivas involucradas en reacciones más complicadas. Una reacción más compleja requerirá lo que
sucede en una reacción simple, que incluye procesos sensoriales, tiempo de conducción nerviosa,
tiempo de movimiento motor, etc., pero también tendrá operaciones cognitivas adicionales.
S1 R1
jueves b
S2 R2
S1 R1
jueves C
S2
ÿ FIGURA 8.1
En la parte superior está la tarea de reacción de Donders A. En este sencillo procedimiento de tiempo de reacción,
un estímulo está vinculado a una respuesta. En el medio está la tarea de reacción de Donders B. En este
procedimiento de tiempo de reacción, dos estímulos están vinculados a dos respuestas. En la parte inferior está la
tarea de reacción de Donders C, en la que hay dos estímulos pero solo uno está vinculado a una respuesta.
Las reacciones más complicadas, B y C, también se ilustran en la figura 8.1. En una reacción
B, que también se conoce como tiempo de reacción de elección, hay más de un estímulo y
más de una respuesta. Cada estímulo tiene su propia respuesta única.
Como se muestra en la figura 8.1, se supone que el observador hace R1 cuando ocurre S1 y R2
cuando ocurre S2 . Cuando su automóvil está en un semáforo, se enfrenta a una reacción B (o
de elección). Si el semáforo está en verde, pisas el acelerador; si es rojo, pisas el pedal del freno.
¿Qué operaciones cognitivas, además de las básicas, son necesarias para una reacción de
elección? Primero, debes identificar la luz como roja o verde. Luego debes seleccionar el pedal
que debes pisar. Por lo tanto, una reacción de elección incluye las operaciones básicas que
ocurren en una reacción simple, así como las operaciones cognitivas de identificación de
estímulos y selección de respuestas.
Para estimar el tiempo requerido para la identificación y selección, necesitamos determinar
un tercer tipo de reacción: la reacción de Donders C, que es la última en la Figura 8.1.
Aquí, como en la reacción B, hay más de un estímulo, pero sólo un estímulo está relacionado con
una respuesta. Si ocurre S1 , se supone que el observador hace R1; si ocurre cualquier otro
estímulo (S2), el comportamiento correcto es abstenerse de responder y no hacer nada.
Esperar en la fila en un restaurante de comida para llevar sería un ejemplo de una reacción C:
hasta que llamen a su número, no debe responder. ¿Qué operaciones cognitivas se necesitan
para realizar una reacción C? Al igual que en la reacción B, debe identificar su número cuando lo
llamen. Sin embargo, una vez que se logra esto, no hay necesidad de seleccionar una respuesta,
ya que solo una respuesta es apropiada. Entonces, la reacción C agrega selección de estímulo a
las operaciones de línea de base pero no incluye selección de respuesta.
Ahora podemos estimar el tiempo requerido para las operaciones cognitivas de identificación
y selección restando los pares apropiados de tiempos de reacción. La reacción C mide la
identificación más una variedad de tiempos de referencia. Por lo tanto, restar el tiempo de reacción
A (RT) del C RT nos dice cuánto tiempo toma la identificación. De manera similar, al restar el C
RT del B se estima el tiempo de selección del estímulo, ya que la reacción B incluye los tiempos
de identificación, selección y línea base, pero la reacción C incluye solo los tiempos de
identificación y línea base. Este procedimiento de estimar el tiempo que lleva realizar varias
operaciones cognitivas se llama método sustractivo. El método sustractivo que utiliza las
reacciones de Donders A, B y C se ilustra en la figura 8.2.
Al principio de la historia de la psicología, Wundt (ver Apéndice A) y sus estudiantes
dedicaron mucho esfuerzo a estudiar el tiempo de reacción usando el método de resta. Sin
embargo, el método pronto fue atacado por psicólogos que confiaban en la introspección como
Tiempo de reacción C
C menos A
B Tiempo de reacción
Tiempo de reacción C
B menos C
Tiempo de referencia
Tiempo de identificación
Tiempo de selección
ÿ FIGURA 8.2
Confusión de temas
Ilustración Pura Inserción
El estudio contemporáneo de los procesos mentales complejos, como la atención, trata de dividir
un proceso complejo en un conjunto de componentes o módulos. ¿Cómo podemos identificar
estos módulos componentes? Un criterio importante es la modificabilidad separada (Sternberg,
2001). Esta es una forma de independencia que ocurre cuando se puede cambiar un módulo de
componente sin cambiar el otro. Si el módulo A, por ejemplo, la ejecución de la respuesta, puede
cambiarse sin alterar el funcionamiento mental del módulo B, por ejemplo, la percepción, y el
módulo B puede cambiarse sin alterar el módulo A, entonces los dos procesos mentales son
modificables por separado.
Es importante darse cuenta de que, si bien el modelo de etapas de Donders predice un orden de
los tiempos de reacción A, B y C, no prueba directamente la suposición de inserción pura. En términos
matemáticos, hay tres ecuaciones y tres incógnitas que se estiman mediante estas ecuaciones. Dado
que el número de ecuaciones e incógnitas es igual, no es matemáticamente posible probar la validez
del supuesto de inserción pura. (En otras palabras, la suposición se usó para generar los resultados y
no quedan grados de libertad para validar la suposición). Mientras que los primeros investigadores
rechazaron la suposición de inserción pura basada en informes introspectivos (Kulpe, 1893), los
investigadores contemporáneos prefieren pruebas de comportamiento más objetivas.
Por lo tanto, podría resultar útil agregar otra medida además del tiempo de reacción.
Se ha demostrado que la fuerza de respuesta, la cantidad de presión ejercida sobre una tecla de
respuesta, es una medida adicional útil en estudios de procesamiento de información humana. Por
ejemplo, la fuerza de respuesta aumenta a medida que aumenta la intensidad del estímulo (Miller, Franz
y Ulrich, 1999) e incluso se puede observar y relacionar con variables independientes cuando no se
exige una respuesta abierta y no se puede medir el tiempo de reacción (Kantowitz, 1972).
Ulrich, Mattes y Miller (1999) realizaron una serie de cinco experimentos que midieron tanto el
tiempo de reacción (RT) como las variables dependientes de la fuerza para las reacciones A, B y C. Su
primer experimento presentó un estímulo visual (LED verde) a la izquierda oa la derecha de un punto
de fijación central. Para la reacción A, los participantes respondieron a cualquiera de las luces con la
misma mano. Para la reacción B, respondieron a la luz de la izquierda con la mano izquierda o a la luz
de la derecha con la mano derecha. La Figura 8.3 muestra sus resultados.
B RT fue significativamente mayor que A RT, como era de esperar. Sin embargo, la fuerza integrada (el
área bajo una curva que muestra la fuerza en función del tiempo) no difirió en las dos reacciones. Este
resultado es consistente con la hipótesis de inserción pura, porque la fuerza de respuesta es la misma
independientemente del tipo de reacción.
Sin embargo, hay algunos problemas potenciales con este experimento. confuso
ocurre cuando se varía simultáneamente más de una variable independiente, de modo que no podemos
estar completamente seguros de qué variable es responsable del resultado. En un experimento estándar
de reacción A de Donders, generalmente solo se asigna un estímulo a la respuesta.
En este experimento, dos estímulos (LED izquierdo y derecho) se asignaron a la respuesta.
(ms)
TR
Fuerza
(cN)
111 110
A B
Tarea
Por lo tanto, existe la posibilidad de que tener que dividir la atención entre dos luces, en lugar
de tener que enfocarse solo en una sola luz, podría cambiar la forma en que se realiza esta
reacción modificada de Donders A. Además, la RT también es proporcional a la intensidad de
un estímulo visual (Ulrich y Mattes, 1996), de modo que los estímulos más brillantes producen
una RT más rápida. Esto se vuelve especialmente importante para las reacciones C donde el
participante solo necesita mirar la luz que está asignada a la respuesta. A los autores les
preocupaba que el brillo aparente se confundiera en la reacción C e hicieron un experimento
especial (experimento 5) para verificar posibles confusiones. Llegaremos a ese experimento en
breve, pero primero debemos discutir sus experimentos que compararon las reacciones B y C.
La figura 8.4 muestra los resultados de un experimento que midió la fuerza y RT para las
reacciones B y C. En la reacción C, los participantes debían responder solo al LED en un lado
del punto de fi jación; no se requirió respuesta para el otro LED. Una vez más, no hubo diferencia
en la fuerza integrada. Sin embargo, ¡tampoco hubo diferencia entre los RT B y C! Esto no es
en absoluto lo que deberíamos esperar: la reacción B debería
RT ÿ FIGURA 8.4
Fuerza
RT y Fuerza Integrada para Reacciones B y
295 291 C. (Datos de Ulrich et al., 1999, experimento 3).
(ms)
TR
Fuerza
(cN)
116 120
B C
ÿ FIGURA 8.5 RT
Fuerza
RT y Fuerza Integrada para Reacciones A y
C. (Datos de Ulrich et al., 1999, experimento 4). 292
262
(ms)
TR
Fuerza
(cN)
137
126
A C
ÿ FIGURA 8.6 RT
Fuerza
RT y Fuerza Integrada para Reacciones B y
C. (Datos de Ulrich et al., 1999, experimento 5). 412
339
(ms)
TR
Fuerza
(cN)
100 100
B C
Los resultados del experimento que se muestra en la Figura 8.4 son problemáticos. Sería una
buena idea replicar este experimento incluyendo las tres reacciones de Donders en el mismo
experimento. Sin embargo, con base en los otros experimentos de la serie, parece razonable concluir
que el modelo propuesto por Donders (Figura 8.2) es correcto y que la suposición de inserción pura
es válida. Sin embargo, los experimentadores aceptan esta conclusión solo para las reacciones de
Donders A y B y argumentan que los datos de fuerza rechazan la inserción pura para la reacción C.
Su argumento depende, en parte, de discusiones sobre la mejor manera de calificar la fuerza de
respuesta que son demasiado detalladas para este libro de texto. Está claro que incluso cinco
experimentos no son suficientes para evaluar la inserción pura, y aunque ha pasado más de un siglo
desde que Donders (1868) introdujo el método de la lógica sustractiva, los investigadores modernos
continuarán estudiando y ponderando sus ideas.
4
Tasas de error
Porcentaje
error
de 3
.2 .3 .4 .5 .6 .7 .8
Probabilidad de estímulo
Tiempo
S1 R1
ÿ
ÿ
ÿ S2 R2
SOA
ÿ FIGURA 8.8
errores
925
850
errores
R2
en
de
% 9.25
8.50
RT
reacción
Tiempo
(ms)
R2
de
775 7.75
700 7.00
50 150 650
los errores aumentaron a medida que disminuyó el tiempo de reacción. Este es un claro ejemplo de una compensación
entre velocidad y precisión. Aunque el aumento de errores en las SOA es pequeño (alrededor del 1,5 por ciento), es
un aumento estadísticamente significativo.
Los resultados que se muestran en la figura 8.9 provienen de un experimento (Pashler, 1989, experimento 4)
en el que S1–R1 eran tonos que conducían a presionar teclas con la mano izquierda y S2–R2.
eran una pantalla de dígitos y una respuesta vocal: el observador decía el nombre del dígito más alto en una pantalla
de ocho dígitos. Esta tarea no es muy exigente, especialmente porque R1 y R2 son marcadamente diferentes, pero
tenga en cuenta que alargar la SOA en 100 ms (una décima de segundo) condujo a una aceleración en el tiempo de
reacción de aproximadamente 75 ms. Al alargar la SOA de 150 milisegundos a 650 milisegundos, se redujo aún más
el tiempo para hacer R2 en unos 140 ms. Así, incluso con comportamientos más bien elementales, el período refractario
psicológico impone severas limitaciones a nuestra capacidad de responder rápidamente a un segundo estímulo. La
compensación entre velocidad y precisión en este experimento es interesante, porque en un experimento por lo demás
idéntico, Pashler demostró que la precisión de R2 no estaba relacionada con SOA cuando no se requería que los
sujetos respondieran rápidamente a S2. Por lo tanto, la precisión de R2 sufre solo cuando debe hacerse rápidamente.
Si Pashler hubiera examinado la precisión de R2, habría observado lo contrario de un período refractario psicológico.
Esto ilustra la importancia de tener múltiples medidas de comportamiento.
¿Cuáles son las causas del efecto del período refractario que se ve en la figura 8.9? Una posibilidad sostiene
que cuanto más cerca en el tiempo están los dos estímulos, más difícil es ejecutar dos respuestas. Esto parece poco
probable, dado que las dos respuestas fueron muy diferentes:
uno manual, el otro vocal. De hecho, dar respuestas vocales y manuales en tareas cotidianas, como conducir, parece
trivialmente fácil. ¿Es una dificultad de selección de estímulos? Esto también parece poco probable, porque los
estímulos son muy diferentes entre sí. en experimentos
RT2
(a)
SOA intermedio
S1 - R1
S2 - R2
RT2
(b)
SOA largo
S1 - R1
S2 - R2
RT2
(C)
RT2
compartidos durante la superposición de tareas, como lo indica la parte central sombreada de la Figura 8.11.
Por lo tanto, RT aumenta.
Dado que ambas clases de modelos predicen el efecto del período refractario psicológico, ¿cómo podemos
determinar cuál es el correcto? Una forma es examinar RT al primer estímulo.
En SOA cortos, esto también se retrasa (Herman & Kantowitz, 1970). Los modelos de cuello de botella no
predicen demoras en RT porque el procesamiento de la tarea 2 no comienza hasta que se completa el
procesamiento de la tarea 1. Los modelos de capacidad compartida predicen un retraso porque la capacidad de
procesamiento de la tarea 1 disminuye tan pronto como comienza el procesamiento de la tarea 2.
Tombu y Joliceur (2003) revisaron cuidadosamente ambos tipos de modelos y llegaron a la conclusión
de que los modelos de capacidad compartida son preferibles, en gran parte debido al retraso del RT al primer
estímulo. Sus conclusiones se basan en datos y teorías publicadas hace más de 30 años, así como en
experimentos recientes. En ciencia, los buenos datos y modelos son eternos. A diferencia de la moda, la última
publicación no es automáticamente la mejor. El valor de las ideas y resultados anteriores no necesariamente se
desvanece con el tiempo. Esta es una de las razones por las que los científicos otorgan un gran valor a la
publicación de los resultados: es posible que nuestro trabajo siga siendo útil mucho después de que ya no
seamos investigadores activos.
Una interacción ocurre cuando los efectos de una variable independiente no son idénticos en
diferentes niveles de otras variables independientes. Como mencionamos en el Capítulo 3, la búsqueda
de interacciones es una de las principales razones para incluir más de una variable independiente en
un experimento. Puede detectar interacciones en los resultados graficados buscando líneas que no
sean paralelas. La comprensión de los efectos de la interacción a menudo plantea cierta dificultad
para el nuevo investigador, por lo que los discutimos aquí y otra vez en el Capítulo 10.
La capacidad de cambiar dinámicamente su foco de atención de un aspecto de un estímulo a
un aspecto diferente se denomina control cognitivo y es un tema principal en el estudio de la atención
que ha sido de interés para los psicólogos durante muchos años. Imagine un experimento en el que
debe responder lo más rápido posible a uno de los cuatro estímulos: un cuadrado rojo, un círculo rojo,
un cuadrado azul y un círculo azul. Si no tiene información anticipada antes de que se presenten los
estímulos, esta es una tarea de tiempo de reacción de Donders B de cuatro opciones.
Pero si tuviera información anticipada parcial que limitara el conjunto de alternativas posibles a solo
dos estímulos, por ejemplo, si supiera de antemano que se presentaría un cuadrado, su tiempo de
reacción será más rápido que un RT de cuatro opciones. Si el tiempo entre la señal que presenta
información de avance parcial y el estímulo es lo suficientemente largo, la TR al estímulo indicado será
igual a la TR de dos opciones (p. ej., Kantowitz y Sanders, 1972).
El tiempo entre la señal y el estímulo se denomina intervalo señal-estímulo; a menudo está en el rango
de 100 a 1000 ms.
La tarea principal sería conducir un vehículo. Por razones de seguridad, este tipo de
investigación se lleva a cabo a menudo en un simulador de conducción. Nuestras variables
independientes podrían ser el tipo de entorno vial definido por la densidad del tráfico (alta
o baja) y la curvatura de la vía (recta, curva pronunciada, curva poco profunda). Algunas
hipótesis específicas podrían ser que la alta densidad de tráfico requiere una mayor
atención y también que negociar curvas pronunciadas requiere una mayor atención. El
desempeño en la tarea de conducción podría medirse por las desviaciones en la posición
del carril desde el centro del carril.
La tarea secundaria sería una reacción de Donders B presentada durante la
conducción. Por ejemplo, el conductor podía escuchar un tono de alta o baja frecuencia y
podía responder presionando uno de los dos botones en el volante.
Las variables de control serían la intensidad de los tonos y las características de manejo
del vehículo. También usaríamos condiciones de control de tarea única (estas no son
variables de control) de conducción sin tarea secundaria y la reacción de Donders B sin
conducción. A menos que el rendimiento de conducción fuera el mismo en condiciones
experimentales y de control, no pudimos llegar a ninguna conclusión sobre las demandas
de atención de la conducción. Por ejemplo, si a los conductores les fue mucho mejor
cuando no se requería ninguna tarea de reacción, esto podría indicar un cambio de
atención de la conducción a la reacción de Donders B cuando se realizaban juntos. La
lógica detrás del uso de tareas secundarias para evaluar la atención exige que siempre se
dedique la misma cantidad de atención a la tarea principal.
1. El interés en el tiempo de reacción comenzó con la ecuación también debe registrar la tasa de error, porque los errores tienden
personal, una diferencia sistemática en los RT encontrada entre a ser mayores cuando una tarea se completa rápidamente. Esto
los astrónomos del siglo XVIII. Este fenómeno llevó a Donders a conduce a un compromiso entre velocidad y precisión.
formular su método sustractivo. 5. Cuando el tiempo de respuesta entre dos señales es muy corto, la
2. Si se resta el Donders A RT del C RT, se obtiene una estimación respuesta al segundo estímulo se ralentiza. Este período
del tiempo de identificación del estímulo. refractario psicológico se comprende mejor ahora que los
Donders B RT menos C RT produce una estimación del tiempo investigadores han medido varios
de selección. variables dependientes generales en el mismo experimento.
3. La confusión ocurre cuando un factor que es covariante con una 6. Las interacciones ocurren cuando el efecto de un inde
variable independiente puede explicar los cambios observados variable dependiente difiere a través de los niveles de otras
en el comportamiento. variables dependientes manipuladas en el mismo experimento.
4. Las variables dependientes deben seleccionarse cuidadosamente, Una interacción entre el nivel de estrés y el intervalo señal-
y el investigador prudente obtiene tantas medidas de estímulo mostró que el estrés altera la estrategia cognitiva.
comportamiento como sea posible. Estudios que miden RT
ÿ TÉRMINOS CLAVE
ÿ PREGUNTAS DE DISCUSIÓN
1. ¿Qué argumentos podría haber usado Kinnebrook para mantener variable dependiente sería útil para comprender su ejemplo.
su trabajo en el Observatorio Real?
2. Discuta los factores de confusión que pueden limitar la utilidad del 4. ¿Cuál es la importancia de la interacción entre el nivel de estrés y
supuesto de inserción pura. el intervalo señal-estímulo? ¿Puedes pensar en algunos ejemplos?
3. Enumere cinco ejemplos de la compensación entre velocidad y
precisión que ocurren en la vida cotidiana fuera del laboratorio. 5. Discutir la posible interacción entre la densidad del tráfico y la
Seleccione uno de sus ejemplos y diseñe un experimento de curvatura de la carretera cuando se utiliza una tarea secundaria
laboratorio que medirá la compensación. para medir las demandas de atención de la conducción.
Vea si puede determinar si un adicional
CONEXIONES WEB
Explore la presentación paso a paso de "Confundidos: Amenazas a la validez" en:
http://psychology.wadsworth.com/workshops/workshops.html
Puede ponerse a prueba en varios experimentos relacionados con la atención y el tiempo de
reacción en:
http://coglab.psych.purdue.edu/coglab/
Puede encontrar una discusión informativa sobre el trastorno por déficit de atención con hiperactividad en:
http://faculty.washington.edu/chudler/adhd.html
PSICOLOGÍA EN ACCIÓN
ÿ TABLA 8.1
número e
Número Tachado número e E's
de Líneas correctamente (1) perdido (2) totales (1) (2) Porcentaje (2) [(1) (2)]
CAPÍTULO 9
ACONDICIONAMIENTO
Y APRENDIENDO
TIPOS DE ACONDICIONAMIENTO
Condicionamiento clásico: ¿Te suena el nombre de Pavlov?
Condicionamiento instrumental (operante)
PRESENTACIÓN DE LAS VARIABLES
9.1 TEMAS EXPERIMENTALES E INVESTIGACIÓN
ILUSTRACIONES
Diseños dentro y entre sujetos: intensidad del estímulo
9.2 TEMAS EXPERIMENTALES E INVESTIGACIÓN
ILUSTRACIONES
Contrapeso: contraste simultáneo
9.3 TEMAS EXPERIMENTALES Y APLICACIONES DE
INVESTIGACIÓN
Diseños con n pequeña : problemas de comportamiento en niños
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: CONOCIMIENTO DE RESULTADOS COMO
REFORZAMIENTO
227
La cita anterior de Mark Twain describe una experiencia de aprendizaje que comparte muchas
características con un tipo de condicionamiento llamado condicionamiento clásico. En el
condicionamiento clásico, la experiencia, como indica Twain, no suele estar bajo el control del
organismo.
El gato no busca la tapa de una estufa caliente para sentarse; más bien, la estufa está caliente
cuando ella se sienta en ella; no hay nada que ella pueda hacer al respecto. Twain también señala
que los efectos del acondicionamiento pueden ser de gran alcance: el gato no volverá a elegir
sentarse en la tapa de una estufa, independientemente de si la tapa está caliente. Este tipo de
condicionamiento es una parte importante de nuestras vidas. Ader y sus asociados han estudiado
algunos de los ejemplos más importantes de condicionamiento clásico.
Siguiendo el trabajo de Herrnstein (1962), Ader y Cohen (1982) querían ver si un placebo
condicionado (ver Capítulo 6) podía influir en la respuesta inmune del cuerpo.
Herrnstein demostró que cuando una solución salina se combinó con un fármaco que puede ralentizar
el comportamiento (escopolamina), la solución salina por sí sola resultó en una ralentización del
comportamiento. Así como el gato de Twain asoció el calor con las tapas de las estufas, incluso las
tapas frías de las estufas, la asociación de la solución salada con la escopolamina condujo a su
comportamiento de producción similar al comportamiento producido por la escopolamina. Ader y
Cohen combinaron el sabor de un líquido novedoso con un fármaco que inhibe el sistema inmunitario.
Después de varios emparejamientos, el nuevo estímulo se convirtió en un placebo, porque también
podía suprimir el sistema inmunitario. A su vez, la supresión inmunológica del placebo evitó el
desarrollo de problemas renales letales en ratones que eran susceptibles a la enfermedad renal.
Tales hallazgos ayudaron a conducir al desarrollo de la psiconeuroinmunología, que es un estudio
interdisciplinario de las interrelaciones entre los procesos conductuales, neurales, endocrinos e
inmunológicos (Irwin & Miller, 2007). Un enfoque principal de este nuevo campo es comprender cómo
el condicionamiento puede modular las respuestas inmunitarias.
No todo condicionamiento involucra eventos que simplemente le suceden al organismo. En el
condicionamiento instrumental, la conducta del organismo es fundamental para producir
consecuencias, a menudo denominadas recompensas y castigos, que alteran el ritmo de las
conductas que han producido las consecuencias. Examinemos un ejemplo de condicionamiento
instrumental en un infante.
El comportamiento de los bebés de entre 2 y 6 meses no es muy complicado, pero sí muestran
movimientos corporales excitados ante estímulos interesantes. Rovee-Collier (1993) aprovechó este
entusiasmo para observar el aprendizaje y la retención en los bebés. Enseñó a los bebés una
respuesta de patada instrumental, siguiendo una patada con el movimiento de un móvil que estaba
suspendido sobre el bebé en su cuna. Una cinta atada a la pierna del bebé y al móvil permite que la
patada del bebé active el móvil. La tasa de patadas cuando está conectado al móvil se compara con
la tasa de patadas en una fase de referencia (ver Capítulo 3) cuando la cinta no conecta al bebé con
el móvil.
Patear es la respuesta instrumental, y Rovee-Collier observó aumentos en las patadas.
ÿ TIPOS DE ACONDICIONAMIENTO
Después de ganar el Premio Nobel, Pavlov recurrió a algunos descubrimientos más o menos
incidentales que había hecho en el curso de su trabajo. Su fama en la psicología experimental actual
surge del trabajo sistemático que realizó sobre estos descubrimientos incidentales, especialmente los
relacionados con la salivación. En un tipo de experimento fisiológico, Pavlov cortó el esófago de un
perro para que ya no llevara comida al estómago (Figura 9.1). Pero descubrió que cuando colocaba
comida en la boca del perro, el estómago secretaba casi tanto jugo gástrico como cuando la comida
iba al estómago. Por supuesto, la comida en la boca producía salivación reflexiva, pero la acción
reflexiva del estómago parecía depender de estímulos ubicados en otros lugares además de los que
estaban en contacto directo con el revestimiento del estómago. Sin embargo, Pavlov hizo un
descubrimiento aún más notable. Encontró que ni siquiera era necesario poner los alimentos en
contacto con la boca para obtener secreciones salivales y gástricas. La mera vista de la comida
produciría las secreciones, o incluso la vista del plato de comida sin la comida, ¡o incluso la vista de la
persona que normalmente alimentaba al animal! Obviamente, entonces, la secreción de jugos gástricos
y saliva debe ser causada por algo más que un reflejo fisiológico automático que se produce cuando
una sustancia entra en contacto directo con el animal. Un reflejo fisiológico es el que muestran todos
los animales físicamente normales de una determinada especie; está “conectado” al sistema nervioso.
Pavlov había descubierto un nuevo tipo de reflejo, al que a veces llamaba reflejo psíquico ya veces
reflejo condicionado. En la figura 9.2 aparece un esquema del paradigma estándar para estudiar el
condicionamiento pavloviano en el laboratorio.
Bettmann/
Corbis
©
ÿ FIGURA 9.1
Ivan Pavlov y su personal se muestran aquí con uno de los perros utilizados en sus experimentos.
El perro estaba enganchado al marco de madera que se muestra en la imagen. La saliva se conducía
mediante un tubo a un dispositivo de medición que podía registrar la tasa y la cantidad de salivación.
Estímulo Neutro
(Campana o tono)
Fase 1
Estímulo incondicionado Respuesta incondicionada
(alimento en polvo) (Salivación)
Estimulo condicionado
(Campana o tono)
Fase 2
Estímulo incondicionado Respuesta incondicionada
(alimento en polvo) (Salivación)
ÿ FIGURA 9.2
Un esquema de las etapas en el condicionamiento clásico. Un estímulo neutro, como una campana,
que no provoca salivación cuando se presenta por sí solo, se entrega al organismo un poco antes que
un estímulo incondicionado, como un alimento en polvo, que produce una respuesta incondicionada, la
salivación. Si el estímulo neutral predice el estímulo incondicionado, luego de varios emparejamientos
(como en la fase 1), el estímulo neutral se asocia con la respuesta incondicionada, indicada por la línea
discontinua en la fase 2. El estímulo neutral ahora se llama estímulo condicionado. . Eventualmente (fase
3), el estímulo condicionado provocará salivación en ausencia del estímulo incondicionado, y esta
salivación se denomina respuesta condicionada (CR). Si el estímulo condicionado se presenta
repetidamente sin el estímulo incondicionado, el CR se debilitará y eventualmente se extinguirá.
Los primeros ejemplos del segundo tipo de condicionamiento fueron los experimentos de EL
Thorndike en la Universidad de Columbia, quien colocó a los gatos en cajas de rompecabezas de las
que se suponía que debían escapar. Estos experimentos se realizaron casi al mismo tiempo que los
de Pavlov. Se describen en detalle en el Capítulo 11; Brevemente, el experimento se refería a
aprender de las consecuencias de alguna acción. Los gatos de Thorndike realizaron alguna respuesta
que les permitió escapar de la caja del rompecabezas; luego, cuando se volvían a colocar en la caja,
tendían a realizar la misma respuesta. Las consecuencias de una conducta afectaron la forma en
que se aprendió. Dado que el comportamiento fue fundamental para producir la consecuencia (la
recompensa), esta forma de aprendizaje se denominó condicionamiento instrumental. Se consideraba
que obedecía a principios diferentes de los del condicionamiento pavloviano y también se consideraba
un tipo de aprendizaje más general.
Investigadores
fotográficos
Omikron/
©
ÿ FIGURA 9.3
Una caja típica de Skinner equipada con una palanca de respuesta y una taza de comida debajo. Una presión
de palanca por parte del animal hace que una bolita de comida caiga en la taza. Toda esta maquinaria está
controlada por un equipo de programación que permite al experimentador establecer diferentes tareas para el animal.
El papel de los estímulos distintos del estímulo reforzante también es importante en el estudio
del condicionamiento operante. Un estímulo discriminativo (SD) señala cuando un comportamiento
será seguido por una recompensa. Por ejemplo, una paloma puede ser entrenada para picotear un
botón para comer solo en presencia de una luz roja. Si alguna otra luz está encendida, el picoteo no
será seguido por la comida. Los animales aprenden tales contingencias entre estímulos y respuestas
con bastante facilidad. Se puede decir que un estímulo discriminativo “prepara el escenario” o “brinda
la ocasión” para alguna respuesta. Una de las tareas principales del condicionamiento operante es
traer alguna respuesta "bajo el control del estímulo". Se dice que un organismo está bajo control de
estímulos cuando responde correcta y consistentemente en presencia de un estímulo discriminativo
y no en su ausencia. Los bebés de Rovee-Collier estaban bajo control de estímulos cuando respondían
al móvil que resultaba en refuerzo.
Recuérdese que los EC efectivos en el condicionamiento clásico son aquellos que están
relacionados contingentemente con el EE. UU. (el CS predice el EE. UU.). El condicionamiento
operante también tiene importantes relaciones contingentes: a saber, la relación entre la respuesta
y el estímulo reforzante. En el condicionamiento operante, los organismos pueden aprender que
existe una contingencia positiva entre el comportamiento y el refuerzo, que es el arreglo estándar de la
Los organismos también pueden aprender que existe una contingencia negativa entre el
comportamiento y el refuerzo, de modo que si responden, no se producirá el refuerzo. Una forma de
examinar esta contingencia es usar un procedimiento llamado extinción experimental,
en el que se retiene el refuerzo después de que un organismo ha aprendido a dar una respuesta
particular. Después de varias veces que el refuerzo no sigue la respuesta, el organismo deja de dar
la respuesta. (Vea la sección “Del problema al experimento” al final de este capítulo para una
discusión adicional sobre la extinción).
Finalmente, los organismos pueden aprender que existe una contingencia nula entre su
comportamiento y el refuerzo. Una contingencia nula es aquella en la que el reforzador es
independiente de la conducta: a veces, una conducta conduce al refuerzo y, a veces, el refuerzo se
produce en ausencia de una conducta particular. Cuando los organismos aprenden que no importa lo
que hagan, ocurrirán eventos aversivos, aprenden a estar indefensos y muestran diversos signos de
depresión (LoLordo, 2001). Asimismo, algunas investigaciones muestran que cuando los eventos
positivos ocurren independientemente del comportamiento, los organismos tienden a volverse
perezosos (Welker, 1976). Es tentador generalizar el último efecto a los "mocosos malcriados" que
reciben un número sustancial de reforzadores positivos no contingentes y luego no se esfuerzan por
conseguirlos cuando es necesario hacerlo.
El segundo problema es más serio; tiene que ver con la variabilidad introducida al utilizar
diferentes grupos de participantes. Un hecho básico de toda la investigación psicológica es que los
sujetos difieren mucho en sus habilidades para realizar casi cualquier tarea (en casi cualquier
variable dependiente). Cuando se utilizan numerosos participantes en diseños entre sujetos, algunas
de las diferencias de comportamiento en las condiciones experimentales resultarán de diferencias
entre los participantes. Esto puede tener el desafortunado efecto de hacer difícil determinar si las
diferencias de los sujetos o la variable independiente determinaron los resultados. En resumen, los
participantes se confunden con los grupos, y en los diseños entre sujetos, esta variabilidad causada
por las diferencias entre sujetos no se puede estimar estadísticamente ni tener en cuenta.
Ambos problemas con los diseños entre sujetos se pueden reducir utilizando diseños dentro
de los sujetos, en los que todos los participantes reciben todos los niveles de la variable.
Los diseños dentro de los sujetos generalmente requieren menos sujetos que los diseños entre
sujetos, porque cada participante sirve en todas las condiciones. Además, las técnicas estadísticas
pueden tener en cuenta la varianza producida por las diferencias entre sujetos. Esto es posible
porque cada uno sirve como su propio control, otra forma de decir que los participantes no se
confunden con grupos, como en un experimento entre sujetos.
Un diseño dentro de los sujetos suele ser más eficaz que un diseño entre sujetos para detectar
diferencias entre las condiciones de la variable dependiente, porque esta varianza debida a las
diferencias de los participantes puede estimarse estadísticamente y tenerse en cuenta. Las técnicas
estadísticas exactas para analizar experimentos dentro de sujetos no se discuten aquí. En general,
el diseño intra-sujetos es más poderoso, es más probable que permita la detección de una diferencia
entre las condiciones, si es que realmente existe una, que el diseño entre sujetos. Esta ventaja hace
que muchos investigadores prefieran el diseño intra-sujetos siempre que sea posible utilizarlo.
Aunque existen ventajas en el uso de diseños intra-sujetos, estos introducen nuevos problemas.
Desafortunadamente, los diseños intra-sujetos simplemente no se pueden usar para investigar
algunos tipos de problemas experimentales, e incluso cuando se pueden usar, tienen requisitos que
los diseños entre sujetos no tienen. Los diseños intra-sujetos no se pueden utilizar en casos en los
que es probable que el rendimiento en una condición cambie por completo el rendimiento en otra
condición. Este problema suele denominarse transferencia asimétrica o efecto de arrastre. Si
queremos saber en qué se diferencian las ratas a la hora de aprender un laberinto con y sin sus
hipocampos (una parte del cerebro relacionada con el aprendizaje y la memoria), no podemos usar
un diseño dentro de los sujetos, ya que no podemos reemplazar un hipocampo una vez que se
retira. . El mismo problema ocurre cada vez que la variable independiente puede proporcionar un
cambio en el comportamiento que se mantendrá hasta que el sujeto sea evaluado bajo la otra
condición.
Si queremos evaluar a las personas en una tarea con o sin capacitación específica, no podemos
evaluarlas primero con capacitación y luego sin capacitación. Y no siempre podemos probarlos en el
orden inverso (sin entrenamiento y luego entrenamiento), porque entonces hemos confundido las
condiciones con la práctica en la tarea. Por ejemplo, si queremos ver si un programa específico de
entrenamiento de la memoria es efectivo, no podemos enseñarle a la gente el programa (la fase de
entrenamiento), probarlos y luego volver a probarlos sin entrenamiento. Una vez que una persona tiene
Los diseños dentro de los sujetos también son inapropiados cuando los participantes pueden averiguar qué
se espera de ellos en el experimento y luego tratar de cooperar con el experimentador para producir los resultados
deseados. Esto es más probable que suceda con diseños dentro de los sujetos que entre sujetos, porque en el
primer caso, las personas participan en cada condición. Este problema hace que los diseños dentro de los sujetos
sean casi inexistentes en ciertos tipos de investigación en psicología social.
Incluso cuando estos problemas no eliminan la posibilidad de utilizar un diseño intrasujeto en algunas
situaciones, existen problemas adicionales que deben considerarse. En los diseños intrasujetos, los sujetos
siempre se evalúan en dos o más puntos en el tiempo; por lo tanto, el experimentador debe estar atento a los
factores relacionados con el tiempo que afectarían los resultados experimentales. Los dos factores principales
que deben considerarse son los efectos de la práctica y los efectos de la fatiga, que tienden a compensarse
entre sí. Los efectos de la práctica se refieren a un mejor desempeño en la tarea experimental simplemente
debido a la práctica, y no a la manipulación de la variable independiente (como en el experimento de la memoria
que acabamos de analizar). Los efectos de fatiga se refieren a disminuciones en el rendimiento durante el
transcurso del experimento, especialmente si la tarea experimental es larga, difícil o aburrida. Los efectos de la
práctica y la fatiga pueden tenerse en cuenta y minimizarse organizando sistemáticamente el orden en que se
presentan las condiciones experimentales a los sujetos.
Esta técnica se conoce como contrapeso de condiciones y se analiza más adelante en el capítulo.
Como hemos dicho, cuando es apropiado, los diseños intra-sujetos son generalmente preferidos a los
diseños entre sujetos, a pesar de que implican una serie de consideraciones adicionales. La principal ventaja,
una vez más, es el hecho de que los diseños dentro de los sujetos suelen ser más potentes o más sensibles,
porque la posibilidad de error resultante de la variabilidad del sujeto se reduce en relación con los diseños entre
sujetos.
Un tercer diseño, el diseño de grupos emparejados, trata de introducir algunas de las ventajas de un
diseño dentro de los sujetos en una comparación entre sujetos. El diseño de grupos emparejados intenta reducir
la variabilidad de los participantes entre los grupos al emparejarlos en los diferentes grupos en otras variables.
Por lo tanto, en un experimento de memoria humana, las personas podrían emparejarse sobre la base del
coeficiente intelectual antes de asignarles aleatoriamente las condiciones. (Cada subgrupo de personas
emparejadas por CI se asigna aleatoriamente a un grupo en particular). La combinación de variables relevantes
puede ayudar a reducir la variabilidad causada por la simple asignación aleatoria de participantes a cada grupo
(el diseño de grupos aleatorios). Además, es muy importante que la asignación a las condiciones siga siendo
aleatoria dentro de conjuntos de personas coincidentes; de lo contrario, existe la posibilidad de confusión y otros
problemas, especialmente artefactos de regresión (véanse los capítulos 2 y 12). En muchas situaciones, el
emparejamiento tiende a implicar mucho trabajo, ya que los participantes deben medirse por separado en la
variable de emparejamiento.
Una técnica de emparejamiento utilizada en la investigación con animales es la técnica de camada dividida.
Esto implica tomar animales de la misma camada y luego asignarlos aleatoriamente a
Grant y Schneider simplemente preguntaron si luces más intensas provocarían un acondicionamiento más
rápido. ¿Una luz brillante haría que las personas desarrollaran una respuesta condicionada más rápido que
una luz tenue? Probaron diferentes grupos en los dos casos, uno con cada intensidad de luz, y descubrieron
que, contrariamente a las expectativas, el condicionamiento fue tan rápido en la condición con luz tenue como
en la condición con luz brillante. Otros investigadores obtuvieron resultados similares cuando examinaron los
efectos de la intensidad del estímulo sobre el condicionamiento en diseños entre sujetos, incluso cuando
utilizaron diferentes estímulos (como tonos en lugar de luces).
La elección de un diseño entre sujetos o dentro de los sujetos suele estar determinada por la naturaleza
del problema estudiado, las variables independientes manipuladas, el número de participantes disponibles
para el investigador y otras consideraciones descritas en la sección anterior. Rara vez los investigadores
consideran la posibilidad de que el resultado mismo de su investigación pueda depender del tipo de diseño
que elijan. Sin embargo, este es exactamente el caso en el tema de los efectos de la intensidad del estímulo
sobre el condicionamiento, como se descubrió después de la investigación de Grant y Schneider (1948).
Años más tarde, Beck (1963) volvió a plantearse la cuestión de si la intensidad del estímulo afectaba al
condicionamiento palpebral. También estaba interesada en otras variables, incluida la intensidad del estímulo
incondicionado (el soplo de aire) y el nivel de ansiedad de sus participantes. Para nuestros propósitos,
consideraremos solo el efecto del nivel de intensidad del estímulo condicionado, que varió dentro de los
sujetos como un factor en un diseño experimental complejo. Beck usó dos niveles de intensidad y los presentó
en un orden irregular en 100 pruebas de acondicionamiento en su experimento. Encontró un efecto grande y
estadísticamente significativo de la intensidad del estímulo en el desarrollo de la respuesta condicionada, al
contrario de lo que habían encontrado otros investigadores.
Grice y Hunter (1964) notaron el efecto de Beck y se preguntaron si ella había encontrado un efecto
donde otros no lo habían encontrado porque ella había usado un diseño dentro de los sujetos, mientras que
la mayoría había usado diseños entre sujetos. Para descubrir esto, probaron tres grupos de personas: en dos
grupos, la variable de intensidad del estímulo condicionado se varió entre sujetos, y para el grupo restante, se
varió dentro de los sujetos. Usaron un tono suave (50 decibelios) o un tono fuerte (100 decibelios) como
estímulos condicionados en un experimento de acondicionamiento de párpados. Las personas de cada grupo
participaron en 100 ensayos. En cada ensayo, los participantes escucharon un zumbador que les alertó de
que un
1
Es posible que haya notado que existe una confusión en el diseño del experimento de Grice y Hunter.
Las personas recibieron 100 intentos con una CS suave o fuerte en el caso entre sujetos, pero los sujetos recibieron la
mitad de cada CS en el caso dentro de los sujetos. Más ensayos deberían producir un mejor condicionamiento para cada
CS para el caso entre sujetos, pero como se muestra en la Figura 9.4, no fue así: en voz alta condujo a un mejor
aprendizaje en el caso dentro de los sujetos, y suave condujo a un mejor aprendizaje en el caso entre sujetos. caso.
Contrapeso de temas
Ilustración Contraste Simultáneo
Siempre que se utilice un diseño dentro de los sujetos, es necesario decidir con cuidado el orden
en el que se deben presentar las condiciones a los sujetos. El arreglo debe ser tal que, en
promedio, las condiciones se presenten en la misma etapa de práctica,
5 Negro 4 8
8 constante
5 Blanco 4 8
5 Negro 4 1
constante 1
5 Blanco 4 1
Negro 2 8
5
Blanco 2 1
Contraste
Negro 2 1
5
Blanco 2 8
ÿ FIGURA 9.5
Un esquema del diseño del experimento de Bower que muestra algunas de las características
utilizadas para minimizar la confusión. El color del callejón no se confunde con el grupo o la magnitud de
la recompensa (número de perdigones). Para el grupo de contraste, se necesita un contrapeso adicional
para equilibrar el orden de las pruebas de uno versus ocho gránulos dentro de la sesión diaria (ver texto).
variando al azar. Como recordará, el contrapeso se refiere a cualquier técnica utilizada para variar
sistemáticamente el orden de las condiciones en un experimento para distribuir los efectos del tiempo de
prueba (como la práctica y la fatiga), de modo que no se confundan con las condiciones.
Cuando se prueban dos condiciones en bloques de cuatro ensayos, hay seis órdenes posibles en los
que las condiciones pueden ocurrir dentro de los ensayos. En el presente caso, si S representa una
recompensa pequeña (una pastilla) y L una recompensa grande (ocho pastillas), entonces las seis órdenes
son SSLL, SLSL, SLLS, LLSS, LSLS, LSSL. Bower resolvió el problema del contrapeso utilizando cada
una de estas órdenes con la misma frecuencia. En un día particular de prueba, elegiría un orden para las
pruebas para la mitad de las ratas (por ejemplo, LSSL) y luego simplemente probaría la otra mitad usando
el orden opuesto (SLLS). Al día siguiente, tomaba otro pedido para la mitad de las ratas, mientras que las
demás recibían el orden inverso, y así sucesivamente. Esto condujo a que no hubiera confusión entre
orden y condiciones, y todas las órdenes se usaron con la misma frecuencia, de modo que el experimento
no dependió de una sola orden. Volveremos sobre este punto en un momento.
Los resultados de Bower se presentan en la figura 9.6, donde la velocidad media de carrera para
cada una de las cuatro condiciones se representa en bloques de 2 días (ocho intentos). Para las ratas que
recibieron una recompensa constante, las que recibieron ocho gránulos se desempeñaron mejor después
de los primeros días que las que recibieron una. Por supuesto, no era exactamente una gran noticia que
las ratas corrieran más rápido por más, en lugar de menos, comida. El verdadero interés estaba en qué tan
rápido corrían las ratas en las condiciones de contraste para obtener recompensas grandes y pequeñas.
Aunque no hubo un efecto estadísticamente confiable entre las velocidades de las condiciones de
Constante 8 y Contraste 8 en la Figura 9.6, las ratas de Contraste 1 corrieron confiablemente más
lentamente por la recompensa que las ratas de Constante 1, al menos hacia el final del entrenamiento.
Esto se denomina efecto de contraste negativo, ya que los sujetos de contraste corrieron más lentamente
por la pequeña recompensa que las ratas que siempre recibieron la pequeña recompensa.
90 contraste 8
80
70
constante 1
60
50
Velocidad
carrera
grupo
media
del
de
Contraste 1
40
30
20
10
0
1-2 5-6 9-10 13-14 17-18 21-22 25-26 29-30
Se pueden sugerir dos soluciones a este problema de los grandes efectos de la práctica al principio del
entrenamiento. Una es dar una serie de ensayos de práctica en la situación experimental antes de que
comience el experimento propiamente dicho. Por lo tanto, los sujetos practican y se permite que el desempeño
en la variable dependiente se estabilice antes de que se introduzcan las condiciones experimentales de
interés. Otra solución es emplear más de un esquema de compensación. Por ejemplo, la mitad de los sujetos
pueden obtener el esquema inverso que recibe la otra mitad. Entonces, la mitad de los sujetos obtendrían
ABBA y la otra mitad obtendría BAAB. La solución de Bower al problema del contrapeso fue la extensión ideal
de esta lógica, ya que utilizó todos los esquemas de contrapeso posibles con la misma frecuencia. Pero
cuando están involucradas más de dos condiciones, esto se vuelve difícil de manejar. En la mayoría de las
situaciones, una solución adecuada al problema de los efectos de la práctica al comienzo de una sesión de
prueba sería dar práctica a los sujetos y luego usar dos esquemas de contrapeso, uno de los cuales es el
inverso del otro.
Grice y Hunter (1964), en el experimento sobre la intensidad del estímulo descrito anteriormente, hicieron
precisamente esto.
Para situaciones en las que hay más de dos condiciones, recomendaríamos un esquema particular
para el contrapeso como generalmente deseable. Este es el diseño de cuadrado latino equilibrado.
Supongamos que hubiera seis condiciones en un orden contrabalanceado de modo que los efectos de la
práctica no confundieran los resultados. Por ejemplo, en un experimento de contraste simultáneo como el de
Bower, se podrían usar seis magnitudes de recompensa diferentes en lugar de solo dos. Un diseño de
cuadrado latino equilibrado aseguraría
a 1 2 6354
b 2 3 1465
C 3 4 2516
d 4 5 3621
y 5 6 4132
F 6 1 5243
que cuando se probara cada condición, sería precedida y seguida por igual de diez por
cualquier otra condición. Esta última característica es muy útil para minimizar los efectos de
arrastre entre las condiciones y hace que el cuadrado latino equilibrado sea preferido a otros
esquemas de contrapeso. Construir un cuadrado latino balanceado es fácil, especialmente si el
experimento tiene un número par de condiciones. Numeremos las seis condiciones de un
experimento del uno al seis. Se puede pensar en un cuadrado latino equilibrado como una
matriz bidimensional en la que las columnas (que se extienden verticalmente) representan las
condiciones probadas y las filas representan los sujetos. En la Tabla 9.1 se presenta un
cuadrado latino balanceado para seis condiciones. Los sujetos están etiquetados de la a a la f,
y el orden en que reciben las condiciones se indica leyendo a través de la fila. Entonces el
sujeto a recibe las condiciones en el orden 1, 2, 6, 3, 5, 4. La fórmula general para construir la
primera fila de un cuadrado latino balanceado es 1, 2, n, 3, n 1 4, n 2 y así sucesivamente, ,
donde n representa
, lugar, simplemente
el número total
numere
de condiciones.
las columnasDespués
con números
de que
más
la primera
altos, comenzando
fila esté en su
de
nuevo cuando llegue a n (como en la Tabla 9.1). Cuando se usa un cuadrado latino balanceado,
los sujetos deben ser evaluados en múltiplos de n, en este caso seis, a fin de contrarrestar
adecuadamente las condiciones con la práctica.
Cuadrado 1 Cuadrado 2
Orden de prueba
a 1 2 534 4 3 521
b 2 3 145 5 4 132
C 3 4 251 1 5 243
d 4 5 312 2 1 354
y 5 1 423 3 2 415
En el caso más simple, un experimento involucra una comparación entre el control y las
condiciones experimentales. Tanto los diseños entre sujetos como los intrasujetos suelen
incluir un gran número de sujetos, aunque el número suele ser menor en el caso intrasujetos.
Se requiere un gran número de sujetos para que un participante inusual no distorsione los
resultados. Estos diseños se denominan diseños de n grande y se han convertido en la norma
en la investigación psicológica; poderosas técnicas estadísticas (ver Apéndice B) permiten al
investigador determinar si vale la pena preocuparse por las diferencias entre las condiciones.
Un enfoque alternativo a tales diseños es el diseño de n pequeña , en el que se analizan
intensamente muy pocos temas. Dos áreas dentro de la psicología experimental a menudo
usan diseños de n pequeña. Tal vez recuerde del capítulo 6 que la psicofísica a menudo usa
diseños de n pequeña. El control experimental es el sello distintivo de la segunda área de
investigación que utiliza diseños de n pequeña: el análisis experimental del comportamiento en
términos de condicionamiento operante. Skinner (1959) instó al uso de diseños de n pequeña
en la investigación operante, porque quería enfatizar la importancia del control experimental
sobre el comportamiento y restar importancia a la importancia del análisis estadístico. Skinner
creía que el análisis estadístico a menudo se convierte en un fin en sí mismo, en lugar de una
herramienta para ayudar al investigador a tomar decisiones sobre los resultados experimentales.
El control experimental que generalmente se logra en la investigación tradicional con un gran
número de sujetos y la inferencia estadística se busca en la investigación de n pequeño
controlando muy cuidadosamente el entorno experimental y tomando numerosas y continuas
medidas de la variable dependiente. La metodología de n pequeña es especialmente apropiada
para la aplicación clínica de técnicas operantes para modificar la conducta. Por lo general, un
terapeuta trata con un solo cliente a la vez, que es el caso límite de un diseño de n pequeña.
Aunque un terapeuta puede tratar a más de un paciente a la vez con métodos similares, los número
El diseño AB
Antes de examinar diseños válidos de n pequeña , analizamos una forma común pero inválida de
evaluar la eficacia de una terapia. La investigación sobre la eficacia de una terapia debe incorporarse
al tratamiento siempre que sea posible. Esto parece un asunto bastante simple: Mida la frecuencia del
comportamiento que necesita ser cambiado, luego instituya la terapia y vea si el comportamiento
cambia. Podemos llamar a esto un diseño AB , donde A representa la condición inicial antes de la
terapia y B representa la condición después de la terapia (la variable independiente) que se introduce.
Este diseño se usa con frecuencia en investigaciones médicas, educativas y otras aplicadas, donde se
instituye una terapia o un procedimiento de entrenamiento para determinar sus efectos sobre el
problema de interés. Sin embargo, el diseño AB (Campbell & Stanley, 1966) falla por completo como
un diseño experimental válido y debe evitarse. Falla porque los cambios que ocurren durante el
tratamiento en la fase B pueden ser causados por otros factores que se confunden con el factor de
interés.
El tratamiento podría producir el cambio en el comportamiento, pero también podrían hacerlo otras
fuentes de las que el investigador no es consciente o no ha podido controlar. No podemos establecer
de manera concluyente que el cambio resultó de la terapia debido a la falta de comparaciones de
control. Una variable de confusión podría haber producido el cambio en ausencia de una variable indepen
Recuerde, la confusión ocurre cuando otras variables se modifican inadvertidamente con el principal
factor de interés, en el caso de la niña, la terapia. Es crucial controlar cuidadosamente las posibles
variables de confusión, de modo que la primaria produzca el efecto. Esto es imposible en el diseño
AB , ya que es posible que el terapeuta-investigador ni siquiera sea consciente de las otras variables.
Una solución estándar al problema involucra un diseño de n grande. Tenemos dos grupos a los
que los sujetos han sido asignados aleatoriamente. Uno, el experimental, recibe el tratamiento; el otro,
el control, no. Si la condición experimental mejora con la terapia y el control no, podemos concluir que
el tratamiento y no algún factor extraño produjo el resultado. En el caso de la terapia en un individuo,
como el caso de la niña que hace berrinches, generalmente no hay un grupo de control potencial y solo
un sujeto en el "grupo" experimental.
Dado que un diseño de n grande depende de tener un número sustancial de sujetos en las condiciones
experimentales y de control, es inapropiado para su uso en la evaluación de muchas situaciones
terapéuticas.
Hart, Allen, Buell, Harris y Wolf (1964) investigaron el llanto excesivo de un alumno de jardín
de infancia de 4 años, Bill, que por lo demás parecía bastante sano y normal.
El llanto a menudo venía en respuesta a frustraciones leves que otros niños enfrentaban de manera
más efectiva. En lugar de atribuir su llanto a variables internas, como el miedo, la falta de confianza
o la regresión a un comportamiento de una edad anterior, los investigadores observaron el entorno
de aprendizaje social para ver qué contingencias de refuerzo podrían producir tal comportamiento.
Decidieron, con un razonamiento similar al ya discutido en el caso de nuestra hijita hipotética, que
la atención de los adultos reforzaba el comportamiento de llanto de Bill. Los investigadores se
propusieron probar esta suposición con un diseño ABA ( en realidad, ABAB) .
0
Días
cualquier número de otros factores, fueron responsables de la terminación del llanto en la primera
fase B. Finalmente, como se trataba de una situación terapéutica, los investigadores instituyeron una
segunda fase B similar a la primera, en la que el llanto de Bill se extinguió nuevamente.
En esta investigación no se empleó estadística inferencial para justificar las conclusiones
extraídas. Más bien, con un buen control de la variable independiente y medidas repetidas de la
variable dependiente, las diferencias entre las condiciones en este experimento fueron lo
suficientemente notables como para disminuir la necesidad de estadísticas inferenciales. El uso de
diseños ABA de n pequeña puede permitir poderosas inferencias experimentales.
La fase A de Rose contó el comportamiento de las dos niñas bajo la dieta KP ordinaria.
La fase B examinó otro tipo de línea de base. Se trataba de la introducción de una galleta de avena
que no contenía colorantes artificiales. La fase C incluyó el nivel de interés de la variable
independiente: galletas de avena con colorante amarillo artificial. Rose eligió este color artificial
porque se usa comúnmente en la fabricación de
TIEMPO
Persona A
(o) BASE TRATAMIENTO
Comportamiento A
Persona B
(o) BASE TRATAMIENTO
Comportamiento B
Persona C
(o) BASE TRATAMIENTO
Comportamiento C
ÿ FIGURA 9.8
Un esquema del diseño de línea de base múltiple. Diferentes personas (entre sujetos) o
diferentes comportamientos (dentro de los sujetos) tienen períodos de referencia de diferentes
duraciones. Las líneas verticales indican cuándo se introdujo la variable independiente (el tratamiento).
Un experimento de Schreibman, O'Neill y Koegel (1983) ilustra muy bien la forma entre sujetos del
diseño de línea de base múltiple. Schreibman y sus compañeros de trabajo querían enseñar procedimientos
de modificación del comportamiento a los hermanos normales de niños autistas para que pudieran
convertirse en maestros efectivos de sus hermanos autistas. El autismo es un trastorno del comportamiento
de origen desconocido. Se caracteriza por un comportamiento social empobrecido, un uso mínimo del
lenguaje y autoestimulación de varios tipos. Para cada uno de los tres pares de hermanos, uno normal (la
edad media era de 10 años) y uno autista (la edad media era de 7 años), se eligieron varias conductas
objetivo, como contar, identificar letras y aprender sobre el dinero. el hermano normal para enseñar al
hermano autista. Dado que los hermanos normales tenían que aprender técnicas correctas de modificación
del comportamiento, como el refuerzo para una respuesta adecuada, los experimentadores primero
registraron medidas de referencia del uso de las técnicas correctas de modificación del comportamiento
por parte de los hermanos normales y el desempeño correcto de los comportamientos objetivo. por los
niños autistas. Los datos de referencia para cada par de niños aparecen a la izquierda de las líneas
verticales en la Figura 9.9. Dado que es probable que el aprendizaje de técnicas de modificación del
comportamiento influya en una amplia variedad de comportamientos del maestro y del alumno (el niño
normal y el autista, respectivamente), se utilizó un diseño de referencia múltiple entre pares de niños. Los
cambios en el comportamiento de los niños normales y autistas después de que los hermanos normales
fueron entrenados para usar los procedimientos de modificación del comportamiento aparecen a la
derecha de las líneas verticales en la Figura 9.9. El desempeño correcto de ambos niños en cada pareja
aumentó después del comienzo del entrenamiento. Schreibman y asociados concluyeron que el
entrenamiento, y no algún otro factor de confusión (como los cambios resultantes de la observación),
alteró el comportamiento.
Tenga en cuenta los puntos de datos representados por signos más y puntos de referencia. Estos
símbolos muestran el comportamiento de los niños en un ambiente que era completamente diferente del
salón de entrenamiento, uno en el que los niños no sabían que estaban siendo monitoreados por los
experimentadores. El comportamiento en este entorno de generalización fue muy similar al comportamiento
en la sala de capacitación, por lo que el programa de tratamiento fue efectivo para lograr cambios
generales en el comportamiento de los niños.
40
20
0
1 234 5 6 7 8 9 10 11 12 13 14 15 16
100 +
Par #2
80 +
rendimiento
Porcentaje
intervalos
correcto
los
de
de
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
100
Par #3
80
60
+ +
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Sesiones
ÿ FIGURA 9.9
Los terapeutas utilizan un diseño de criterio cambiante en una variedad de situaciones de terapia
conductual. Kahng, Boscoe y Byrne (2003) utilizaron un diseño de este tipo para aumentar la aceptación de
alimentos en Clara, una niña de 4 años. Bebía de una botella, pero no comía. El terapeuta usó un procedimiento
inteligente de escapar de la comida dependiendo de un cierto número de bocados de comida. Además, si Clara
aceptaba un bocado de comida, recibía elogios y luego, en terapia, una ficha de Blues Clues que podía jugar
después de la comida. El terapeuta aumentó el número de bocados de criterio para escapar del entorno de
comida de su comida favorita (puré de manzana). Gradualmente aceptó la compota de manzana más fácilmente
con aumentos en el criterio. La aceptación de otros alimentos también aumentó gradualmente.
Al final de la terapia cumplió con el criterio de 15 mordiscos de todos los alimentos en aproximadamente 16
minutos. En una comida de seguimiento 6 meses después de la terapia, comió más del 90 por ciento de 50
bocados en 10 minutos.
McDougall y sus asociados (McDougall, Hawkins, Brady y Jenkins, 2006; McDougall y Smith, 2006) han
desarrollado variaciones interesantes del diseño de criterio cambiante. El criterio de cambio de límite de rango
implica criterios que especifican los límites superior e inferior del comportamiento objetivo. Por lo tanto, un niño
que necesita más ejercicio aeróbico podría tener criterios que especifiquen la cantidad mínima y máxima de
carrera para cada período de ejercicio. El diseño de criterios distribuidos comparte características del diseño
de línea de base múltiple y el diseño de tratamientos alternos. En este diseño, un niño que no jugaba bien con
los demás podría tener criterios para la cantidad de tiempo que pasa en solitario y en juegos sociales durante el
recreo. Estos porcentajes y criterios se distribuyen en dos o más comportamientos y se pueden cambiar a lo
largo del tiempo para aumentar el comportamiento deseado (juego social en este caso). Una lección que
aprender del trabajo de McDougall es que los diversos diseños son formas poderosas de cambiar el
comportamiento y que la combinación de estos diseños puede mejorar la situación terapéutica.
Una serie de variables pueden contribuir al PREE típico. Cuando las ratas son
recompensadas solo en una parte de los ensayos, una serie de factores pueden variar
ÿ PREGUNTAS DE DISCUSIÓN
1. Analice las ventajas de los diseños intrasujetos. C. Un experimento diseñado para responder a la pregunta
¿Qué complicaciones y problemas conlleva el uso de un de si el color del cabello de una mujer afecta la
diseño intra-sujetos? probabilidad de que la inviten a salir.
2. Discuta las ventajas y desventajas de usar
un diseño entre sujetos. d. Un estudio en el que se comparan tres técnicas de
3. En cada uno de los siguientes casos, indique si sería mejor entrenamiento diferentes en cuanto a su eficacia para
examinar la variable independiente en un diseño enseñar trucos a los animales.
intrasujetos o entre sujetos. Justifique su respuesta en 4. Indica qué es un cuadrado latino equilibrado y explica por
cada caso. qué es un esquema de contrapeso preferido en muchas
una. Un estudio psicológico social de la ayuda, en el que situaciones. Dibuje dos cuadrados latinos balanceados
los investigadores están interesados en cómo el similares a los de las tablas 9.1 y 9.2 para los casos en
tamaño del grupo afecta si un individuo ayudará o no los que hay (a) tres condiciones y (b) cuatro condiciones.
a otra persona del grupo.
b. Un estudio del efecto de variar el volumen de un tono 5. Los resultados de algunos experimentos descritos en este
para medir la rapidez con la que las personas pueden capítulo mostraron diferentes efectos de una variable
responder al tono. independiente cuando se manipulaba entre
CONEXIONES WEB
Explore la presentación paso a paso de "Entre y dentro de los diseños" en:
http:// academic.cengage.com/psychology/workshops/student_resources/
talleres/entre1.html
Una descripción general útil del aprendizaje está disponible en:
http://www.funderstanding.com/theories.cfm
Una buena discusión sobre el diseño de la investigación se puede encontrar en:
http://trochim.human.cornell.edu/kb/expfact.htm
PSICOLOGÍA EN ACCIÓN
Lo siguiente se basa en un famoso experimento realizado por Thorndike (1932). Proporcionamos una variante de
su procedimiento que fue sugerida por Snellgrove (1981). Thorndike les vendó los ojos a los sujetos y les pidió que
dibujaran líneas de 3 pulgadas de largo. Se produjeron pocas o ninguna mejora en la precisión cuando los sujetos no
recibieron el conocimiento de los resultados, pero Thorndike encontró una rápida configuración del comportamiento
cuando se les dio el conocimiento de los resultados: a las personas se les dijo "correcto" cuando estaban dentro de un
octavo de pulgada y "equivocado" cuando estaban desviados por más de un octavo de pulgada. Usted variará el tipo
de retroalimentación: a algunos participantes no se les dirá nada, a otros se les dirá "bien" cuando estén dentro de un
octavo de pulgada de 3 pulgadas, y a un tercer grupo se le dirá exactamente cuánto largo dibujó una línea (para un
dieciseisavo de pulgada). Necesitarás papel, lápices, una regla y una venda para los ojos.
Cada persona recibirá 10 ensayos, con un único tipo de conocimiento de resultados. Registre la precisión (hasta un
dieciseisavo de pulgada) en cada prueba para cada persona, de modo que pueda comparar la tasa de progreso en las
10 pruebas para cada forma de retroalimentación.
Podría usar un diseño dentro de los sujetos, en el que una persona intenta dibujar diferentes longitudes de línea
(por ejemplo, 2 pulgadas, 3 pulgadas y 5 pulgadas) bajo una de cada una de las condiciones de retroalimentación. Con
un diseño dentro de los sujetos, deberá equilibrar el tipo de retroalimentación a lo largo de la línea, así como el orden
de las condiciones a lo largo del experimento. Este experimento probablemente se realice mejor con un diseño entre
sujetos, debido a los efectos de arrastre relativamente permanentes que resultan de los diferentes tipos de
retroalimentación.
CAPÍTULO 10
RECORDANDO
Y
OLVIDANDO
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
RECURSOS DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: RECORDANDO EL 11-S
ATAQUES TERRORISTAS
261
¿Qué experiencias puedes recordar de tu año en el octavo grado? Piense en ellos por un momento.
Aprendiste muchos hechos allí; te pasaron muchas cosas Probablemente nunca recordará ni siquiera
una pequeña fracción de los hechos que aprendió o las experiencias que tuvo entonces. ¿Qué ha
pasado con estos recuerdos? ¿Se pierden para siempre? ¿O los recuerdos todavía están almacenados
en algún lugar pero nunca se recuerdan activamente porque no ha tenido una situación apropiada
para traerlos a la mente? Hay algunas cosas que nunca olvidarás, aunque quieras, pero otras que no
puedes recordar, por más urgente que sea la necesidad. Si un romance en ciernes tuvo un final
catastrófico, este recuerdo de sus días en el octavo grado puede quedarse con usted mucho después
de que otros eventos hayan sido relegados a los oscuros rincones del pasado. ¿Por qué?
El humorista Robert Benchley, en un ensayo titulado "Lo que me hizo la universidad", intentó
recordar las cosas que había aprendido en la universidad años antes y clasificarlas según el año en
que las aprendió. Había 39 artículos en la lista. Recordó 12 cosas de su primer año; esto disminuyó a
solo 8 cosas recordadas de su último año. Un muestreo selectivo de la lista de Benchley aparece en
la Tabla 10.1.
Es selectivo solo con respecto a la cantidad de piezas de información incluidas, por lo que brinda una
representación justa de la profundidad y el alcance del conocimiento duradero adquirido en la
universidad. Por supuesto, debería estar feliz y orgulloso de saber que usted también puede tener
pronto un título universitario, un certificado que proclama su conocimiento de ciertos hechos básicos
como estos.
¿Es esto todo lo que Benchley realmente recuerda de sus días de universidad? Si hiciera una
lista de sus días en el octavo grado, probablemente sería igual de breve. Esto lleva a una pregunta
interesante: ¿Cómo podemos estudiar los recuerdos que no se pueden recordar? Si una persona no
puede recordar una experiencia, ¿podemos suponer que el rastro de memoria que representa esa
experiencia se ha desvanecido?
La investigación experimental de la memoria humana fue iniciada por un psicólogo alemán, Hermann
Ebbinghaus (Figura 10.1; véase Boneau, 1998, para una reseña biográfica).
Ebbinghaus fue un verdadero pionero científico. Él creía, a diferencia de su famoso contemporáneo,
Wilhelm Wundt (ver Apéndice A), que la psicología experimental podría desarrollarse para estudiar
los procesos mentales superiores y no solo los procesos sensoriales. Su principal logro fue demostrar
cómo la investigación empírica podía responder preguntas interesantes sobre la memoria. Esta
investigación se publicó en 1885 en un libro extraordinario, Memory: A Contribution to Experimental
Psychology. Una de las primeras preguntas que enfrentó Ebbinghaus fue la que hemos estado
considerando: cómo medir la memoria. Ebbinghaus sirvió como único sujeto en todos sus
experimentos; los materiales que inventó para ser memorizados son
llamadas sílabas sin sentido. Por lo general, usaba sílabas sin sentido que contenían una
vocal intercalada entre dos consonantes (por lo tanto, llamadas sílabas CVC), como ZOK, VAP,
etc. Al usar estas sílabas, esperaba minimizar la influencia de las asociaciones lingüísticas que
habrían estado presentes si hubiera usado palabras, oraciones o (como lo hacía a veces)
pasajes de poesía como materiales para recordar. (Investigaciones posteriores han demostrado
que las sílabas "sin sentido" son un nombre inapropiado, porque algunos elementos que usó
fueron palabras. Además, al aprender incluso palabras sin sentido, las personas las imbuyen de si
Ebbinghaus seleccionó estas sílabas al azar de un conjunto maestro de 2300 y las colocó
en listas que variaban en longitud. Si la lista contenía, digamos, 30 sílabas sin sentido,
Ebbinghaus se leía las sílabas en voz alta a un ritmo uniforme. Inmediatamente después, tapaba
la lista y luego intentaba repetírsela a sí mismo.
Bettman/
Corbis
©
o escribirlo. Obviamente, en el primer intento, esta hazaña fue imposible, pero pudo medir el número de
sílabas que pudo recordar correctamente. Luego leía la lista en voz alta por segunda vez, intentaba
recordarla, y así sucesivamente. Una medida de la dificultad de recordar una lista que usó Ebbinghaus es el
número de ensayos de estudio/prueba (o la cantidad de tiempo) necesarios para una recitación perfecta de
la lista. Esto se llama una prueba de criterio de medida de la memoria; fue ampliamente utilizado en la
investigación de la memoria durante años, aunque ahora es raro.
Supongamos que Ebbinghaus quisiera probar su memoria de una lista un mes después de aprenderla.
Podría, como señal inicial, proporcionarse la primera sílaba sin sentido de la lista.
Pero supongamos que esto no lo ayudó a recordar la lista y que, por mucho que lo intentó, no pudo recordar
nada más. ¿Significaría esto que la serie que había memorizado un mes antes no había dejado una
impresión duradera? ¿Cómo podríamos saberlo? Ebbinghaus inventó un ingenioso método para responder
a esta pregunta. Al medir la memoria de una serie de sílabas sin sentido, Ebbinghaus intentó volver a
aprender la serie, tal como la había aprendido en primer lugar, leyéndola repetidamente en voz alta y luego
intentando recitarla o escribirla. Una vez más, pudo medir el número de intentos o la cantidad de tiempo
necesario para aprender la lista. La memoria de la lista en el momento de volver a aprender podría medirse
por los ahorros en términos de menos intentos o menos tiempo necesario para volver a aprender la lista;
esta medida de la memoria se podría obtener incluso cuando una persona no pudiera recordar nada del
material antes de volver a aprenderlo. Ebbinghaus descubrió que incluso cuando no podía recordar ninguna
de las sílabas sin sentido de una lista, a menudo mostraba un ahorro considerable en el número de intentos
o la cantidad de tiempo que le tomaba volver a aprender la lista, lo que indica que la memoria de la lista
podría existir. sin recuerdo activo.
El puntaje de ahorro que usó Ebbinghaus fue el porcentaje de intentos ahorrados al volver a aprender
una lista en relación con el número original de intentos necesarios para aprender la lista en primer lugar. Por
ejemplo, si Ebbinghaus hizo 10 intentos para aprender una lista de sílabas sin sentido en orden, y luego,
una semana más tarde, solo tomó 5 intentos para volver a aprender la lista, esto representaría un ahorro del
10 5
50 por ciento (100%). Para decirlo10de manera
diferencia
más general,
entre elelnúmero
porcentaje
de intentos
de ahorro
en se
el aprendizaje
define comooriginal
la
(OL) de un
Quizás se pregunte si los hallazgos de Ebbinghaus son representativos de la memoria humana en general,
ya que estudió un solo sujeto (él mismo) repetidamente, un método que rara vez es aceptable en la investigación
moderna.
Sin embargo, sus hallazgos se han replicado muchas veces con grupos más grandes de sujetos y todavía
se consideran válidos. (La importancia de la "replicabilidad" o repetibilidad de los resultados experimentales se
analiza en el Capítulo 11).
100
80
60
Porcentaje
Ahorro
de
40
20
0
1 8 24 48
Intervalo de retención en horas
ÿ FIGURA 10.2
La curva del olvido. Ebbinghaus midió los ahorros en volver a aprender una lista de sílabas sin
sentido después de que habían transcurrido varios períodos de tiempo desde el aprendizaje original.
Observe que el olvido es rápido al principio y luego se nivela.
ÿ VARIEDADES DE MEMORIA
El término memoria es bastante amplio y abarca muchos tipos diferentes de destrezas y habilidades.
Todos tienen en común las propiedades de que algo se aprende, se retiene con el tiempo y luego se
usa en alguna situación particular, pero más allá de eso, los tipos de memoria pueden diferir
considerablemente (consulte Roediger, Marsh y Lee, 2002, para obtener un resumen). Probablemente
hayas tenido una experiencia como esta: te presentan a tres personas y olvidas por completo el
nombre de la primera persona cuando le das la mano a la tercera. Este olvido espectacularmente
rápido parece bastante diferente del olvido más lento estudiado por Ebbinghaus. Recordar
información como un número de teléfono durante un breve intervalo refleja la memoria a corto plazo
o de trabajo, y algunos psicólogos creen que tiene propiedades diferentes de la memoria a largo
plazo (el tipo que estudió Ebbinghaus) y que debería considerarse una memoria distinta. sistema o
tienda. Una forma de definir la memoria a corto plazo es la recuperación de la información poco
después de haber sido percibida, incluso antes de que haya dejado la conciencia (James, 1890). La
memoria a largo plazo, entonces, se refiere a la recuperación de recuerdos que han desaparecido
de la conciencia después de su percepción inicial.
Esta definición general de memoria a largo plazo parece hoy demasiado amplia para la mayoría
de los psicólogos, que hacen más distinciones entre los tipos de memoria. Estos se analizan con
más detalle más adelante en el capítulo, cuando ilustramos cómo se estudia la memoria de diferentes
maneras. Una distinción básica que guía gran parte de la investigación actual es la memoria explícita
versus la memoria implícita (Graf & Schacter, 1985; Schacter, 1987). La memoria explícita (a veces
llamada memoria episódica) se refiere al recuerdo consciente de eventos (o episodios) en la vida
de uno. Se les puede pedir a las personas que recuerden lo que aprendieron en un momento o lugar
en particular o que distingan las cosas que les sucedieron de distracciones plausibles. Los ejemplos
serían responder a la pregunta de qué hizo el sábado pasado por la noche, qué aprendió en su
curso de introducción a la psicología o qué ha hecho hasta ahora. Las tareas que normalmente se
usan para medir tanto la memoria a corto como a largo plazo se clasificarían como pruebas de
memoria explícita, porque a las personas se les dice explícitamente que recuperen información de su pas
La memoria implícita, por otro lado, se refiere a la expresión del aprendizaje pasado en el que
una persona no necesita hacer ningún esfuerzo consciente para recuperar información del pasado
(Roediger & McDermott, 1993; Schacter, 1990). Simplemente sucede, más o menos automáticamente.
Por ejemplo, cuando te agachas para atarte los cordones de los zapatos, no necesitas decirle a
Las pruebas de reconocimiento son generalmente de dos tipos. mejoraría mucho si hubiera leído la palabra fresa antes,
En las pruebas de reconocimiento de sí/no , a las personas aunque no se le pidió explícitamente que recordara haberlo
se les da el material original que estudiaron, como palabras, hecho. Estas pruebas son especialmente interesantes porque
mezclado con una serie de elementos (palabras) nuevos pero se comportan de manera muy diferente a las pruebas
generalmente similares. Los sujetos responden sí o no a cada tradicionales de memoria explícita, como el recuerdo y el
palabra, según crean que estaba en la lista original. Las reconocimiento. En cierto sentido, las "leyes de la memoria"
pruebas de reconocimiento de elección forzada son son diferentes cuando se examinan con estas pruebas
pruebas de opción múltiple. Se presentan varias alternativas, implícitas que con las pruebas estándar de memoria explícita.
de las cuales sólo una es correcta, y el sujeto del experimento
se ve obligado a elegir la alternativa correcta. Decisión forzada Más adelante en el capítulo, examinaremos más de cerca
estas pruebas implícitas.
Se prefieren las pruebas a las pruebas de sí/no porque
corregir las conjeturas es un problema menor. Variables independientes
Las pruebas de recuerdo y reconocimiento no son
dicotómicas; más bien, pueden verse como si estuvieran en En los experimentos sobre la memoria humana se manipulan
un continuo, siendo la dimensión la cantidad de información muchos tipos de variables. Una de las variables más populares
dada sobre el material, o el poder de las pistas de recuperación históricamente ha sido la naturaleza del material presentado
presentadas. Si GRA se presenta como una pista para la para la memoria. Pueden ser letras, dígitos, sílabas sin
palabra GRAPH, sentido, palabras, frases, oraciones, párrafos o largos pasajes
que aparecían en la lista, ¿es esta una prueba de recuerdo o de prosa; las características de cada uno de estos tipos de
de reconocimiento? material también pueden ser variadas. Por ejemplo, las
En cada caso, la medida dependiente en las pruebas palabras que se refieren a objetos concretos (cigar, rhi
de recuerdo y reconocimiento es el número o proporción de noceros) se recuerdan mejor que las palabras abstractas
elementos correctamente recordados o reconocidos en (beauty, dread), cuando otros factores relevantes, como la
diferentes condiciones o el número de errores, que equivale longitud de la palabra, se mantienen constantes (Paivio,
a lo mismo. 1969). Varias otras variables independientes importantes
cosa. A veces se usa una medida derivada, como d de la serán consideradas en los experimentos.
teoría de detección de señales
Continuado
usted mismo, “¿Cómo hago esto? ¿Cuándo aprendí a hacer esto? ¿Puedo recordar cómo? En cambio, el
comportamiento ocurre relativamente sin esfuerzo, y si te detienes a reflexionar sobre cómo lo estás
haciendo exactamente, es posible que te vaya peor. Por supuesto, la información expresada implícitamente
fue aprendida, pero el quid de la distinción es que, a diferencia del recuerdo explícito, las expresiones
implícitas de la memoria no requieren que las personas recuperen conscientemente información de su
pasado. De hecho, como veremos más adelante en el capítulo, los patrones de desempeño en las pruebas
de memoria explícitas e implícitas suelen ser bastante diferentes (Roediger, 1990).
XGR 679
¿Como hiciste? Lo más probable es que hayas recordado perfectamente el trigrama. La gente casi siempre
lo hace en la primera prueba de los experimentos que utilizan esta tarea. Sin embargo, el recuerdo disminuye
cuando se utilizan varios intentos con un trigrama diferente en cada intento, de modo que después de cuatro
o cinco intentos, los sujetos suelen recordar los trigramas correctamente solo el 50 por ciento del tiempo,
con un intervalo de retención de 18 segundos (Figura 10.3). ). Este fenómeno se denomina interferencia
proactiva, ya que las primeras pruebas en esta tarea interfieren con el recuerdo en pruebas posteriores.
En el experimento de Scarborough (1972), todos los sujetos recibieron 36 trigramas de consonantes
presentados durante 0,7 segundos en la técnica de Brown-Peterson. Había tres grupos de seis sujetos; el
método en el que se presentaron los trigramas difirió para cada
1.0
.8
3 segundos
.6
Proporción
correcta
.4
18 segundos
.2
0 1 246 3 5
Número de intentos
ÿ FIGURA 10.3
ÿ FIGURA 10.4
Resumen esquemático de una prueba típica en el procedimiento de memoria a corto plazo de Brown-Peterson,
como se usa en el experimento de Scarborough.
grupo. Un grupo de sujetos vio los trigramas (solo condición visual), un grupo escuchó los trigramas
(solo auditivo) y un tercer grupo vio y escuchó los trigramas (auditivo visual). El tiempo de
presentación se controló cuidadosamente haciendo que los trigramas se presentaran en una
grabadora o un taquistoscopio, un dispositivo para exponer y eliminar rápidamente la información
visual. Un segundo después de la presentación del trigrama, los sujetos escucharon un número de
tres dígitos, excepto en una condición en la que se pidió a los sujetos que recordaran el trigrama
inmediatamente (la condición de intervalo de retención de 0 segundos). Los sujetos en cada
condición debían retener las letras durante intervalos de retención de 0, 3, 6, 9, 12 o 18 segundos.
Una vez que se presentaba el número de tres dígitos, se pedía a los sujetos que contaran hacia
atrás de tres en tres en voz alta a razón de una cuenta por segundo (al compás de un metrónomo)
para evitar que ensayaran el trigrama. Al final del intervalo de retención, el metrónomo se detuvo
y se encendieron dos luces verdes, lo que indica el período de recuperación de 10 segundos. Por
lo tanto, cada prueba consistió en una señal de advertencia (dos luces amarillas y un tono) que
indicaba que el trigrama estaba a punto de mostrarse; presentación del trigrama; presentación del
número de tres dígitos (con la única excepción que se acaba de señalar); el intervalo de retención
durante el cual los sujetos contaron hacia atrás de tres en tres; y, finalmente, el período de
recuperación. Un ensayo típico se ejemplifica en la Figura 10.4. Este procedimiento se repitió 36
veces (seis ensayos en cada uno de los seis intervalos de retención, en un orden equilibrado) con
diferentes trigramas. En resumen, se combinaron tres condiciones entre sujetos (solo visual, solo
auditivo, visual y auditivo) con seis condiciones dentro de los sujetos (intervalos de retención de 0,
1, 3, 6, 9, 12 o 18 segundos) en el experimento. .
1.0
.9
.8
.7
.6
Probabilidad
correcto
informe
de
.5
.4
.3
.2
.1
0 3 6 9 12 18
Intervalo de retención
ÿ FIGURA 10.5
un mayor porcentaje del tiempo que los sujetos que recibieron solo presentación auditiva.
Además, recibir información en ambas modalidades simultáneamente no produjo mejor
recuerdo que presentar la información solo visualmente; el porcentaje correcto en cada
intervalo de retención es aproximadamente el mismo para sujetos solo visuales y visuales
más auditivos. Hasta aquí todo bien. Pero, ¿qué más podemos concluir de la figura 10.5?
Específicamente, ¿podemos concluir algo sobre las tasas de olvido de la información que
se presenta de forma auditiva y visual? ¿La tasa de olvido es la misma o diferente en los dos
Scarborough (1972) fue bastante cuidadoso a este respecto. Aunque las funciones
solo auditivas y solo visuales parecen divergir cada vez más a medida que se alarga el
intervalo de retención, no llegó a la conclusión de que la tasa de olvido es mayor para la
información presentada a través de los oídos que a través de los ojos. Sin embargo,
considere lo que dijo otro escritor sobre este experimento en su libro de texto:
La figura muestra que las curvas interceptan la ordenada Y aproximadamente en el mismo punto y
divergen significativamente. El valor de intercepción en cero seg. proporciona una medida de la
percepción y almacenamiento original de los estímulos, ya que mide cuánta información tiene el
sujeto inmediatamente después de la presentación de los estímulos, cuando no se ha producido
ningún olvido. La tasa de olvido se puede determinar a partir de las pendientes de las funciones de
olvido. De acuerdo con este análisis, la Figura 10.5 muestra que los ítems presentados auditivamente
se olvidan mucho más rápido que los ítems presentados visualmente (Massaro, 1975, pp. 530-531).
Una forma de evitar este problema en el experimento de Scarborough sería ignorar los
puntos de datos en el intervalo de retención de 0 segundos y preguntar si la tasa de olvido es
mayor entre 3 y 18 segundos para la presentación auditiva que para la visual. Esto podría
hacerse calculando una interacción entre la presentación y el intervalo de retención en el rango
de 3 a 18 segundos; pero simplemente inspeccionando la figura 10.5, puede hacerse una idea
de si los puntos solo auditivo y solo visual son cada vez más divergentes. Son entre 3 y 9
segundos, pero después de eso, la diferencia entre ellos se mantiene constante.
Sin embargo, esta falta de una diferencia cada vez mayor en los últimos tres puntos puede
deberse a un efecto suelo en la condición solo auditiva, ya que el rendimiento es muy bajo,
especialmente en el último punto (solo el 7 u 8 por ciento correcto). Se debe ser muy cuidadoso
al interpretar los datos cuando hay efectos techo o piso. Un investigador prudente dudaría en
sacar alguna conclusión de los datos de la figura 10.5 sobre las tasas de olvido: el índice de Scarboro
350
325
300 300
275 275
250 250
225 225
200 200
175 175
150 150
0 0
Antes Después Antes Después
(a) (b)
ÿ FIGURA 10.6
El panel (a) ilustra la situación tal como la creían los hombres con sobrepeso: comenzaron
con el mismo peso y uno perdió el doble que el otro. El panel (b) revela el caso real, con el
efecto techo en la escala de medición eliminado. De hecho, ambos hombres perdieron 100
libras. La atenuación de escala (efectos techo y suelo) puede ocultar las diferencias reales
que pueden existir entre las condiciones de un experimento.
acercarse exactamente. Pero también debemos señalar que en los intervalos de retención en los que
no hay efectos techo ni suelo (3, 6 y 9 segundos), parece haber más olvido con la presentación
auditiva que con la visual, de acuerdo con la conclusión de Massaro citada anteriormente. .
¿Cómo se pueden evitar los problemas de los efectos suelo y techo en la investigación
psicológica? Desafortunadamente, no se puede dar una regla estricta. Los investigadores suelen
tratar de diseñar sus experimentos de modo que eviten los extremos en el rendimiento; luego, a
menudo ponen a prueba sus intuiciones sobre el desempeño en la tarea probando pequeños grupos de
Si estos sujetos rinden cerca del techo o del piso de la escala, a menudo será necesario revisar la
tarea experimental. Por ejemplo, si el rendimiento en un experimento de memoria es demasiado
bueno, se puede aumentar la cantidad de material que se proporciona para reducir el rendimiento. De
manera similar, si la tarea es tan difícil que las personas apenas recuerdan nada, se puede facilitar la
tarea reduciendo la cantidad de material, presentándolo más lentamente, etc. La idea es diseñar
tareas y escalas de desempeño para que las personas normalmente obtengan puntajes en rangos
medios. Luego, a medida que se manipulan las variables independientes, se pueden observar mejoras
o disminuciones en el desempeño de las personas. El investigador prudente por lo general hará el
esfuerzo de evaluar a los sujetos piloto antes de lanzarse a un experimento que puede resultar más
tarde defectuoso debido a los efectos techo o suelo. La prueba de sujetos piloto también permite al
investigador aprender acerca de otros problemas en el diseño o procedimiento del experimento.
Mencionamos en el Capítulo 3 que hay muchas maneras de probar una hipótesis y que los
experimentos individuales que prueban una hipótesis, aunque informativos hasta cierto punto, deben
verse en el contexto de otros experimentos diseñados para probar la misma hipótesis de otras
maneras. Idealmente, a los investigadores les gustaría que los experimentos que prueban una hipótesis
particular en una variedad de situaciones converjan en una conclusión, pero en realidad, a menudo no
es así. El problema es de generalidad de los resultados: a menudo, la conclusión extraída de una
situación experimental no se generaliza a otras situaciones. Esto es frustrante pero inevitable. También
es importante. Siempre debemos hacernos estas preguntas después de que algún experimento haya
mostrado un efecto de alguna variable independiente sobre alguna variable dependiente: ¿A qué
poblaciones de sujetos se generaliza este efecto? (El hecho de que un efecto sea válido para las ratas
no significa necesariamente que lo sea para las personas; véase el capítulo 15.) ¿Bajo qué escenarios,
experimentales o extraexperimentales, se mantiene esta conclusión? ¿Se mantendrá la conclusión
cuando las variables independientes y dependientes se operacionalicen o definan de una manera
ligeramente diferente a como lo hacen en el experimento original? La cuestión de la generalidad surge
en todos los tipos de investigación. Si grandes dosis de alguna droga producen cáncer en ratones de
laboratorio, ¿debería prohibirse el consumo humano de esta droga, incluso cuando el nivel de dosis
es mucho más pequeño y el organismo es completamente diferente? Por supuesto, probar con
animales es un primer paso crítico para descubrir si una sustancia es dañina (o útil) antes de probarla
en humanos, pero los efectos en una especie no significan necesariamente que se encontrarán los
mismos efectos en otra especie.
Para ilustrar las cuestiones que rodean el problema de la generalidad de los resultados,
consideramos experimentos relacionados con los niveles de enfoque de procesamiento de la
memoria. Craik y Lockhart (1972) propusieron que la memoria podría verse como un subproducto de
la percepción y, además, que la percepción podría concebirse como un progreso a través de varias
etapas o niveles. Por ejemplo, considere su percepción y comprensión de la palabra YATE. Craik y
Lockhart (1972) notaron que una persona presta atención a las características en diferentes "niveles"
cognitivos cuando lee una palabra así. Un primer nivel es el de los rasgos superficiales de las
apariencias: la palabra tiene cinco letras, incluye una vocal, está en mayúsculas, etc. La percepción
de las letras de la palabra es un primer paso para leerla; un grafémico
Se requiere un nivel de análisis (letra). En segundo lugar, la lectura de muchas palabras va
acompañada de la traducción de la forma escrita a algún código común (fonémico) que se comparte
con las palabras que se escuchan. El código se llama fonético (o fonológico) porque se supone que
se basa en fonemas, los patrones de sonido básicos de un idioma. Confiaríamos en un código fonético
cuando decidiéramos que yate rima con caliente, aunque las palabras no se parezcan. Una tercera
etapa, o nivel, de procesamiento es la determinación del significado de una palabra. El propósito de la
lectura es derivar el significado de las palabras, saber qué es un yate. Esto se conoce como un nivel
semántico de análisis.
Craik y Lockhart (1972) propusieron que percibir palabras (o cualquier otra cosa) implicaba el
progreso a través de las etapas desde la apariencia (niveles superficiales del sistema cognitivo) hasta
el significado (niveles profundos del sistema cognitivo). Además, argumentaron que el recuerdo
posterior de las experiencias estaba directamente relacionado con la profundidad del procesamiento
durante la percepción inicial: cuanto más profundo sea el nivel de procesamiento durante la percepción
inicial, mejor debería ser el recuerdo de la experiencia.
Los resultados de Craik y Tulving (1975) confirmaron estas predicciones de manera impresionante.
Examinaron la memoria mediante una prueba de reconocimiento en la que a los sujetos se les dieron las
60 palabras antiguas (aquellas sobre las que habían respondido preguntas) junto con 120 palabras nuevas.
Se les dijo a los sujetos que trataran de elegir y encerrar en un círculo exactamente 60 palabras que
habían visto en la fase anterior del experimento. Debido a que los sujetos tenían que elegir 60 palabras,
el rendimiento aleatorio (es decir, el nivel esperado para las personas que nunca habían visto las palabras)
habría sido del 33 por ciento (60 de 180). Los resultados se muestran en la Figura 10.7 para aquellas
palabras que recibieron una respuesta afirmativa durante la fase de estudio. El reconocimiento aumentó
desde justo por encima del azar con el procesamiento superficial y grafémico de la apariencia de la
palabra hasta casi la perfección con un nivel de procesamiento profundo y semántico. La única diferencia
entre las tres condiciones durante la fase de estudio fue el proceso mental muy breve que se produjo
cuando la persona respondió la pregunta, por lo que este experimento muestra el poder de los procesos
de codificación incluso muy rápidos en la memoria. Los resultados se ajustaron muy bien a las predicciones
de la teoría de los niveles de procesamiento.
90
80
70
Reconocido
correctamente
Porcentaje
60
50
40
Niveles de Procesamiento
ÿ FIGURA 10.7
Resultados de Craik y Tulving (1975). Los sujetos respondieron preguntas sobre palabras
que fueron diseñadas para efectuar diferentes niveles de procesamiento: grafémico (¿Está en
letras mayúsculas?), fonémico (¿Rima con ____?) y semántico (¿Está en la categoría ____?).
De acuerdo con el enfoque de niveles de procesamiento, cuanto más profundo era el nivel de procesamiento
original, más preciso era el reconocimiento en la prueba posterior. (Según Craik y Tulving, 1975.)
Los resultados de Craik y Tulving (1975) son poderosos, pero ¿qué tan generales son? Los sujetos del
experimento eran estudiantes universitarios muy seleccionados; los materiales eran palabras sueltas sobre las que
se hacían preguntas; la prueba era de reconocimiento, con sujetos obligados a responder con un número fijo de
palabras (por lo que tenían que adivinar); y el nivel de procesamiento fue operacionalizado (manipulado) de una
manera particular. ¿Alguna o todas estas características fueron críticas para producir los resultados de Craik y
Tulving (1975)? Como discutimos en el Capítulo 3, cada experimento implica muchas opciones para decidir cómo
se prueba una teoría o hipótesis en particular. Se necesita más investigación para determinar la generalidad de los
hallazgos.
Jenkins (1979) ha propuesto una forma interesante de pensar sobre el tema de la adaptabilidad general de
los resultados, tal como se representa en su modelo tetraédrico de experimentos de memoria .
se muestra en la figura 10.8. (Un tetraedro tiene cuatro caras; de ahí el nombre.) Jenkins (1979) señaló que
cualquier investigador que explore la memoria debe elegir entre cuatro dimensiones, ya sea que esa dimensión en
particular sea o no de interés en el experimento (es decir, incluso si es una variable de control). Estos son (1) los
sujetos que se evalúan, (2) el material utilizado para aprender y evaluar, (3) las tareas de orientación (o las
características del entorno en el que se evalúan los sujetos) y (4) el tipo de prueba usó. Roediger (2008) observó
recientemente que hay incluso más dimensiones que deben considerarse, pero aquí nos centraremos en las cuatro
originales de Jenkins. En el experimento de Craik y Tulving (1975), los investigadores estaban interesados en cómo
la tarea de orientación (las preguntas que orientaban a los sujetos a procesar las palabras de formas particulares)
afectaba la retención. Los otros tres no eran de interés, por lo que se controlaron estas posibles variables: todos los
sujetos eran estudiantes universitarios, la prueba de memoria era de reconocimiento y los materiales utilizados eran
palabras.
El marco de Jenkins (1979) señala que cualquier resultado experimental debe verse en el contexto de otras variables
potenciales que podrían haber sido manipuladas. La cuestión de la generalidad de los resultados se puede enmarcar
de la siguiente manera: si se manipularan las otras variables de control, ¿se mantendrían los mismos resultados? Si
la variable independiente se definiera operativamente de una manera diferente, ¿se replicaría el resultado? Pasamos
ahora a la investigación que ayuda a responder esta pregunta sobre los niveles de efecto de procesamiento. (La
siguiente cobertura no está completa, pero ilustra los puntos mediante el uso selectivo de ejemplos).
Asignaturas
¿Las personas que no sean estudiantes universitarios muestran los niveles de efecto de procesamiento (mejor
memoria para el material procesado de manera significativa)? En general, la respuesta aquí hasta la fecha es sí.
Por ejemplo, Cermak y Reale (1978) probaron pacientes con síndrome de Korsakoff,
•
•
•
Orientación de tareas/configuraciones
Pruebas (Tareas Criterios)
Instrucciones
retiro libre
Estrategias Recuerdo con clave
Expectativas
Reconocimiento
Contexto
Transferir
•
•
•
•
•
•
Materiales
Palabras
Fotos
Párrafos
Organización
•
•
•
ÿ FIGURA 10.8
un trastorno cerebral que sufren algunos alcohólicos crónicos debido a una deficiencia de vitaminas.
Una característica del síndrome de Korsakoff es un grave déficit de memoria en las pruebas de memoria
explícita, como el recuerdo o el reconocimiento. No obstante, Cermak y Reale (1978) descubrieron que
los pacientes de Korsakoff sí mostraban un nivel de efecto de procesamiento cuando se les evaluaba
de manera similar a Craik y Tulving (1975). Aunque el rendimiento fue mucho más bajo en general para
Materiales
¿Se pueden encontrar efectos de nivel de procesamiento con materiales que no sean listas de palabras?
Obviamente, el efecto sería de poco interés si no se generaliza más allá de esta restricción. Smith y
Winograd (1978) mostraron rostros de personas a razón de uno cada 8 segundos. A un grupo se le pidió
que decidiera si cada persona tenía o no una nariz grande (un juicio superficial). A otro grupo se le dijo
que juzgara si cada persona era amistosa (un juicio profundo). En una prueba de reconocimiento
posterior, los sujetos que juzgaron las caras por su amabilidad las reconocieron mejor que aquellos que
las juzgaron por el tamaño de la nariz, confirmando los niveles básicos del efecto de procesamiento con
las caras.
Como se mencionó en la sección anterior, Murphy y Brown (1975) probaron a niños en edad
preescolar con imágenes en un nivel de paradigma de procesamiento y también replicaron el efecto
básico. Lane y Robertson (1979) también encontraron un nivel de efecto de procesamiento en la memoria
de los jugadores de ajedrez para las posiciones en los tableros. También se han encontrado niveles de
efectos de procesamiento con materiales tan diversos como caracteres chinos (Lee, 2002) y acciones
simples (Zimmer & Engelkamp, 1999).
En general, existe evidencia de que el nivel de procesamiento de ideas puede extenderse al
material no verbal, aunque ciertamente es cierto que la gran mayoría de los niveles de procesamiento de
la investigación han utilizado material verbal. Sin embargo, Intraub y Nicklos (1985) informaron una
excepción a este patrón. Hicieron que las personas miraran imágenes y respondieran preguntas físicas
(¿Esto es horizontal o vertical?) o preguntas que requerían acceso al significado (¿Esto es comestible o
no comestible?). Más tarde, pidieron a los sujetos que recordaran las imágenes escribiendo una frase
descriptiva de una o dos oraciones. Sorprendentemente, descubrieron que las preguntas físicas
conducían a una mejor retención que las preguntas significativas, un patrón inverso al habitual. El
resultado no puede descartarse como una casualidad, porque replicaron el hallazgo en seis experimentos
en diversas condiciones. El hallazgo inusual de Intraub y Nicklos (1985) representa algo así como un
misterio; hasta ahora nadie ha explicado satisfactoriamente por qué encontraron un nivel inverso del
efecto de procesamiento (juicios físicos superiores a los juicios significativos) en la retención de imágenes.
Pero las excepciones a un patrón general pueden generar oportunidades para el avance teórico, como
veremos en la siguiente sección.
Otra dimensión de interés en el nivel de experimento de procesamiento son las preguntas particulares
(o las tareas de orientación) utilizadas para inducir un procesamiento superficial y profundo. Craik y Tulving
(1975) hicieron que los sujetos juzgaran el tipo de letra de las palabras (mayúsculas o minúsculas) para la
dimensión física superficial y juzgaran si la palabra pertenecía o no a una categoría particular (¿animal?) para
el nivel profundo. Pero se podrían usar muchos otros tipos de preguntas para dirigir la atención de los sujetos
a la superfi -
aspectos especiales o significativos de las palabras. Por ejemplo, Hyde y Jenkins (1969) preguntaron a los
sujetos si las palabras contenían letras particulares (¿una e ?) como tarea superficial y que calificaran el
agrado de las palabras como tarea profunda. Esta manipulación también produjo un nivel robusto de efecto
de procesamiento. En general, numerosas manipulaciones con materiales verbales convergen en la misma
conclusión: la retención es más pobre después de tareas de orientación físicas (superficiales) que después
de tareas de orientación significativas (profundas).
Por lo tanto, el nivel de efecto de procesamiento es generalmente robusto en muchas variaciones del
paradigma experimental básico con materiales verbales y con recuerdo o reconocimiento como pruebas de
memoria.
Tipo de prueba
La cuarta dimensión en el modelo de experimentos de memoria de Jenkins (1979) es el tipo de prueba
utilizada para evaluar la memoria. Las medidas estándar de la memoria han sido variaciones en las pruebas
de recuerdo y reconocimiento. Los efectos del nivel de procesamiento se han encontrado repetidamente con
ambos tipos de prueba. Sin embargo, los investigadores han encontrado otro tipo de pruebas en las que el
nivel de procesamiento no tiene efecto (Fisher & Craik, 1977; Jacoby & Dallas, 1981; McDaniel, Friedman &
Bourne, 1978) o incluso un efecto inverso (Morris, Bransford, & francos, 1977). Este descubrimiento ha
ayudado a refinar las ideas sobre los niveles de procesamiento y condujo a un nuevo enfoque, el
procesamiento apropiado para la transferencia. La idea básica que guía esta investigación es que la forma de
una prueba, qué tipo de conocimiento aprovecha, puede determinar qué actividades de codificación son útiles
para la prueba.
Morris y asociados (1977) realizaron un experimento similar en muchos aspectos al experimento original
de Craik y Tulving (1975). Usaron estudiantes universitarios como sujetos y les pidieron que hicieran juicios
sobre las palabras. Las preguntas sobre las palabras (p. ej., EAGLE ) se diseñaron para inducir un nivel de
procesamiento fonético ("— ¿rima con legal ?") o un nivel semántico ("— ¿es un pájaro grande?"). Los sujetos
respondieron preguntas fonémicas para la mitad de las palabras y preguntas semánticas para la otra mitad,
con la respuesta correcta.
.70
.60
correctamente
reconocida
Proporción
.50
.40
.30
.20
Condición de codificación
ÿ FIGURA 10.9
Resultados de Morris, Bransford y Franks (1977). Después de responder preguntas sobre palabras
diseñadas para hacerles pensar sobre el sonido de la palabra (codificación fonémica) o significado
(codificación semántica), los sujetos tomaron una prueba de reconocimiento estándar (panel izquierdo) o una
prueba de reconocimiento de rima en la que tenían que seleccionar palabras que rima con las palabras
originales estudiadas (panel derecho). Los niveles habituales de efectos de procesamiento se encontraron con la
prueba de reconocimiento estándar, pero la codificación fonémica produjo un mejor rendimiento que la codificación
semántica en la prueba de reconocimiento de rimas. Por lo tanto, los tipos de procesamiento no son
inherentemente superficiales o profundos, sino que dependen de la forma en que se debe usar la información.
Un procesamiento deficiente para un tipo de prueba puede ser un buen procesamiento para otra prueba.
El efecto de interacción es un término estadístico que surge del uso del análisis de varianza en la
evaluación de experimentos multifactoriales, o aquellos que tienen más de una variable independiente.
Los efectos de interacción se conocen más comúnmente como interacciones y se discutieron
previamente en los Capítulos 3 y 8. (El análisis de varianza se describe en el Apéndice B). Sin embargo,
debido a que el concepto de interacciones es tan importante, lo consideramos nuevamente con algo más
de detalle. . Además, hemos descubierto que es un concepto que molesta un poco a los estudiantes, por
lo que los tratamientos repetidos deberían proporcionar una mejor comprensión del tema.
Como recordará, los experimentos multifactoriales son aquellos en los que dos o más variables
independientes se manipulan al mismo tiempo. Un efecto de interacción ocurre cuando el efecto de una
variable independiente difiere según el nivel de la otra variable independiente. Ya ha estado expuesto a
los efectos de interacción varias veces en este capítulo, aunque no nos referimos a ellos como tales. Por
ejemplo, los resultados de Scarborough (1972) que se ven en la figura 10.5 muestran que la superioridad
de la presentación visual sobre la auditiva en su paradigma de memoria a corto plazo dependía del
intervalo de retención utilizado. De manera similar, los resultados de Morris y asociados (1977) que se
muestran en la figura 10.9 muestran una interacción entre el nivel de procesamiento durante el estudio y
el tipo de prueba realizada. Los ejemplos utilizados en esta sección son similares a los de Morris y
asociados (1977).
Se dice que la memoria se prueba implícitamente, porque aunque los sujetos no tienen que tratar de recordar
las palabras estudiadas para realizar la tarea, su desempeño mejora espontáneamente por las exposiciones
previas.
Esta mejora en el rendimiento se llama cebado. Para medir el priming, los investigadores evalúan a los
sujetos en una mezcla aleatoria de fragmentos de palabras que estudiaron y palabras que no estudiaron. La
puntuación de preparación de cada persona se puede calcular restando la proporción de elementos no
estudiados que se resolvieron (la línea base no estudiada) de la proporción de elementos estudiados
completados. Por ejemplo, suponga que ha estudiado 10 palabras. Más tarde, recibe una prueba de fragmentos
con fragmentos de las 10 palabras que ha estudiado, más otros 10 fragmentos de palabras que no ha
estudiado, mezclados al azar. Si resuelve fragmentos para 5 de las 10 palabras estudiadas (50 por ciento),
pero solo 2 de las 10 palabras no estudiadas (línea de base no estudiada del 20 por ciento), entonces su
puntuación inicial sería 0,50 0,20 0,30. (Para asegurarse de que la diferencia entre las palabras estudiadas y
las no estudiadas no se deba simplemente a que los elementos estudiados son más fáciles, los elementos se
equilibran entre los sujetos. Es decir, la mitad de los sujetos estudian la mitad de los elementos, mientras que
los otros sujetos estudian la otra mitad). la mitad de los ítems. Por lo tanto, durante el transcurso del
experimento, cada ítem aparece como un ítem estudiado y no estudiado con la misma frecuencia. Consulte el
Capítulo 9).
Otro ejemplo de una prueba de memoria implícita es la prueba de finalización de raíz de palabra. En esta
prueba, las personas ven raíces de palabras que son las primeras tres letras de una palabra, como ele___, y
se les dice que completen la raíz con la primera palabra que les venga a la mente. ¿Qué palabra se te ocurrió
para completar esta raíz? Lo más probable es que hayas pensado en "elefante" en lugar de "elemento" o
"elegante", etc., porque te prepararon con esa palabra en un párrafo anterior. La misma preparación ocurre
cuando las personas estudian una lista de palabras antes de realizar la prueba de finalización de raíz de
palabra.
También se han utilizado varios otros tipos de pruebas de memoria implícita, pero no los describiremos
aquí (ver Roediger & McDermott, 1993). La característica crítica de estas pruebas es que todas se pueden
realizar sin que las personas necesariamente se den cuenta de que están recordando el episodio de estudio
anterior, aunque sus respuestas estén influenciadas o “preparadas” por el material que han visto anteriormente.
A veces se dice que estas pruebas
Amnesia
El interés en la distinción entre medidas de memoria implícitas y explícitas surgió originalmente de la
investigación con amnésicos (p. ej., Warrington y Weiskrantz, 1970). Los pacientes con amnesia tienen
daño cerebral por cualquiera de varias fuentes, como alcoholismo crónico (síndrome de Korsakoff),
anoxia (pérdida de oxígeno al cerebro), cirugía o lesión en la cabeza; muestran graves déficits de
memoria en las medidas de retención explícitas.
Por lo general, pueden recordar o reconocer muy poco sobre la información presentada recientemente,
aunque sus otras funciones cognitivas estén intactas. ¡Algunos casos son tan profundos que los médicos
del paciente deben volver a presentarse cada vez que se reúnen con el paciente!
El siguiente extracto está tomado de un libro de Wayne Wickelgren (1977), quien trabajó con pacientes
amnésicos.
Una vez, en el curso de la prueba de una de estas personas, tuve una experiencia bastante espeluznante.
El paciente era un joven de unos veinte años que recientemente había sufrido daño cerebral debido a un
accidente de esgrima inusual. Suzanne Corkin me presentó al paciente diciendo algo como: “Este es
Wayne Wickelgren”. El joven respondió: "Wickelgren, ese es un nombre alemán, ¿no?" Dije que no."
Luego dijo "¿irlandés?" Nuevamente dije “no”. Luego dijo "¿escandinavo?" y respondí “sí”. Hablé con él
durante unos cinco minutos y luego tuve que irme para hacer una llamada telefónica. Cuando regresé,
todos estaban parados en aproximadamente los mismos lugares que antes. Sue, al darse cuenta de que
el paciente no sabría que me había conocido antes, me volvió a presentar. Después de que ella dijo: “Este
es Wayne Wickelgren”, él procedió a decir: “Ese es un nombre alemán, ¿no es así?”. Respondí, “no”.
Luego dijo: "¿Irlandés?" Dije “no” y él dijo “¿escandinavo?”, exactamente la misma serie de preguntas que
me había hecho la primera vez que me vio (p. 326).
Para más ejemplos de las dificultades que enfrentan los amnésicos en la vida diaria, el lector interesado
debería adquirir el libro de Philip Hilts (1995) sobre HM, quien es probablemente el amnésico más
famoso. Hilts, un reportero, relata cómo HM no recordaba haber presenciado un accidente (a pesar de
que HM estaba en un auto que tuvo que virar bruscamente para evitar chocar con el auto volcado) y
cómo HM seguía sin estar seguro del estado de su padre 4 años después de su muerte. muerte del
padre. Por lo tanto, el recuerdo explícito de los amnésicos se ve gravemente afectado, en comparación
con el de los sujetos normales. En el pasado, a menudo se planteó la hipótesis de que los amnésicos
carecían de la capacidad de aprender y almacenar nueva información verbal.
En 1970, Elizabeth Warrington y Lawrence Weiskrantz decidieron evaluar la memoria de los
amnésicos de una manera diferente e hicieron un descubrimiento que ha cambiado mucho la forma en
que los científicos piensan sobre la amnesia, en particular, y el funcionamiento de la memoria en general.
Warrington y Weiskrantz pidieron a amnésicos y sujetos de control (pacientes sin enfermedad
neurológica) que estudiaran listas de 24 palabras y luego probaron sus recuerdos de varias maneras
diferentes. (Estudiaron diferentes listas para cada prueba de memoria). Discutimos dos de las pruebas
aquí.
La primera prueba era una prueba tradicional de recuerdo libre explícito, en la que simplemente se
instruía a los sujetos para que recordaran tantas palabras como fuera posible. Como era de esperar, los
amnésicos recordaron muchos menos elementos (33 por ciento) que los controles (54 por ciento).
La segunda prueba era una prueba implícita, en la que los sujetos veían palabras perceptualmente
degradadas (se borraban partes de cada letra, de modo que ninguna de las palabras podía ser interpretad
Interacciones
En general, se dice que dos variables independientes interactúan cuando el efecto de una variable
(sobre la variable dependiente) cambia en diferentes niveles de la otra variable.
Hemos optado por ilustrar este concepto con nuestra discusión de las pruebas de memoria implícita y
explícita porque exhiben muchas interacciones interesantes. Es decir, las pruebas de memoria implícita
y explícita responden de manera diferente a las manipulaciones de ciertas variables independientes.
Las variables que tienen un gran efecto en una prueba implícita pueden no tener ningún efecto, o
incluso el efecto contrario, en las pruebas explícitas. Ahora ilustraremos las interacciones que
involucran pruebas de memoria implícita y explícita examinando algunos patrones diferentes de
resultados que podrían haberse obtenido en el experimento de Warrington y Weiskrantz, descrito en
la sección anterior.
La figura 10.10 contiene cuatro conjuntos de datos hipotéticos que ilustran diferentes patrones
de resultados que Warrington y Weiskrantz podrían haber observado en su experimento comparando
memoria implícita y explícita en sujetos amnésicos y de control. Los datos de las tablas de la izquierda
se ilustran en los gráficos de barras correspondientes (en los paneles centrales) y gráficos de líneas
(a la derecha). Tenga en cuenta que, técnicamente, las variables representadas aquí no deben
trazarse en gráficos de líneas; se representan de esta manera aquí solo para facilitar las comparaciones
de los diferentes formatos para presentar los datos. Discutiremos cada pantalla a su vez. Mientras
analizamos cada ejemplo, examine el patrón de datos en la tabla y luego observe cómo aparecen los
datos cuando se trazan en los gráficos.
El ejemplo A se incluye como punto de partida para demostrar cómo se verían los datos cuando
no hay interacción entre las variables. Aquí, los sujetos de control se desempeñan mejor que los
amnésicos tanto en las pruebas explícitas como implícitas, mostrando un efecto principal del grupo
de sujetos. Es decir, los sujetos cuyos recuerdos están intactos (controles) tienen mejores recuerdos
que los amnésicos, independientemente de cómo se pruebe la memoria. Por lo tanto, no hay
interacción entre el grupo de memoria y el tipo de prueba en este ejemplo. Los efectos principales son
generalizaciones; nos dicen que en cada nivel de una variable (aquí, tipo de prueba), se observó el
mismo efecto en la otra variable (aquí, los controles se desempeñaron mejor que los amnésicos).
El ejemplo B ilustra un posible tipo de interacción que podría obtenerse. En este caso, los
controles funcionan mejor que los amnésicos en la prueba de recuerdo libre explícito, pero los
amnésicos funcionan tan bien como los controles en la tarea de identificación de palabras. En otras
palabras, la diferencia tradicional entre los grupos amnésico y control desaparece cuando la memoria
se mide implícitamente. Así, el efecto de una variable independiente (la presencia o ausencia de un
déficit de memoria) cambia, dependiendo del nivel de la otra variable independiente (tipo de prueba).
Este es un ejemplo de lo que significa una interacción entre dos variables.
El ejemplo C ilustra un tipo de interacción que los investigadores suelen encontrar más
interesante, conocida como interacción cruzada. La razón de este nombre se ilustra mejor en el
gráfico de líneas C. En nuestro ejemplo, los sujetos de control muestran mejor memoria que los
amnésicos en la prueba explícita, pero los amnésicos muestran mejor memoria que los controles.
.40 .40
Retirada gratuita Fragmento de palabra
Terminación
.35 .35
.30 .30
.25 .25
Cebado
.20 .20
.15
Proporción
correcta
.15
.10 .10
.05 .05
.00 .00
Imágenes Palabras Fotos Palabras
Tipo de material
ÿ FIGURA 10.11
Resultados de Weldon y Roediger (1987). Las imágenes se recordaron mejor que las palabras en las
pruebas de recuerdo libre explícito, pero las palabras produjeron más preparación que las imágenes en la
prueba de finalización de fragmentos de palabras implícitas. El patrón general revela una interacción cruzada.
.50 .50
Proporción
correcta .40 Proporción
correcta .40
.30 .30
.20 .20
Una interacción hipotética de orden superior que involucra el tipo de prueba, el déficit de memoria y el nivel
de procesamiento (grafémico versus semántico).
han revelado cosas interesantes sobre los trastornos de la memoria, como la amnesia, pero también están
brindando una gran cantidad de información nueva sobre la memoria normal.
La lectura puede permitirnos repasar rápidamente el material que comprendemos bien y detenernos en las
ideas difíciles. Pero mientras leemos, podemos ser más propensos a simplemente deslizar nuestros ojos
sobre la página y soñar despiertos; un conferenciante moviéndose y hablando podría captar mejor nuestra
atención.
Hipótesis Los sujetos que leen un pasaje largo de material estarán mejor
capacitados para responder preguntas de opción múltiple sobre el material
que los sujetos que escuchan a otra persona leyendo el material.
A pesar de que esta hipótesis es bastante específica, aún quedan muchas cuestiones abiertas a la
interpretación al realizar el experimento. Es necesario dar definiciones operativas a las variables. ¿Cuánto
dura un “pasaje largo”? ¿Cuál debe ser el tema del pasaje? ¿Deberíamos usar más de un pasaje? ¿Cómo
debe presentarse el pasaje que se va a leer? ¿Cuánto tiempo debe durar la presentación? ¿Quién debería
leer el pasaje, o deberíamos variar eso?
¿Qué tipo de preguntas debemos hacer en la prueba de opción múltiple (reconocimiento de opción
forzada)? ¿Deberíamos usar un diseño entre sujetos o intra-sujetos? Estas son solo algunas de las
preguntas que deben responderse al traducir la hipótesis en un experimento real. La forma en que
decidimos estos asuntos puede afectar el resultado del experimento.
Consideremos primero la última pregunta y analicemos estas preguntas en orden inverso. ¿Deberíamos
usar cada sujeto tanto en las condiciones de lectura como de escucha, o deberíamos usar diferentes
grupos de sujetos en las dos condiciones? En
¿Cuánto debe durar el pasaje? Esto está estrechamente relacionado con el tiempo que
debe durar la presentación. Supongamos que decidimos que las pruebas de reconocimiento
deben durar unos 7 minutos en cada caso. Entonces podríamos querer limitar el tiempo de
presentación de cada pasaje a 15 minutos para que el experimento dure solo una hora.
(Debe haber unos 15 minutos asignados para las instrucciones, la entrega y la recogida de
las pruebas y la explicación del experimento cuando haya terminado).
Quizás el aspecto más complicado de diseñar este experimento es decidir exactamente
cómo se presentarán los pasajes durante los minutos en cada condición de presentación.
Supongamos que elegimos pasajes que tardan 15 minutos en leerse en voz alta en la
condición Escuchar. En la condición en que los sujetos leen el pasaje, ¿deberíamos
simplemente permitirles 15 minutos para leerlo? Entonces es muy probable que tengan más
tiempo de presentación real, ya que la mayoría de las personas pueden leer en silencio más
rápido que en voz alta. Por lo tanto, los sujetos que leyeron el pasaje podrían dedicar más
tiempo al material difícil. ¿Queremos tratar de eliminar esto de alguna manera, por ejemplo,
instruyendo a los sujetos para que lean el pasaje una vez de principio a fin? ¿O queremos
dejarlo como una de las diferencias naturales entre leer y escuchar que estamos tratando
de investigar? Si de alguna manera eliminamos o minimizamos la regresión (releyendo el
material) en la condición de lectura y luego encontramos que escuchar es mejor
Esta área de investigación que examina las diferencias de modalidad en la retención a largo
plazo de materiales en prosa ha recibido sorprendentemente poca atención. Sin embargo, dos
referencias relevantes son King (1968) y Kintsch y Kozminsky (1977). Más recientemente, los
investigadores se han interesado por las implicaciones de esta pregunta para el periodismo
(Eveland, Seo y Marton, 2002; Furnham, 2001). Es decir, ¿las personas recuerdan más las
noticias si leen una noticia o si escuchan un reportaje en la televisión o la radio? Podría pensar
en cómo podría modificar el estudio descrito en esta sección para que sea más aplicable a la
pregunta de periodismo aplicado.
ÿ RESUMEN
1. Ebbinghaus fue el primer psicólogo en estudiar el aprendizaje Los métodos de ahorro todavía se usan hoy en día, la
y la memoria de forma sistemática. Resolvió el problema de mayoría de los investigadores miden la memoria de otras
cómo estudiar recuerdos irrecuperables reaprendiendo maneras: por lo general, con alguna variación de las pruebas
material y midiendo los ahorros en el número de intentos de de recuerdo (producción) y reconocimiento (discriminación
reaprendizaje en comparación con los necesarios para el del material estudiado del no estudiado).
aprendizaje original. A pesar de que
grupo de edad, ¿está justificado concluir que la capacidad de interacciones indican que las generalizaciones simples sobre
memoria es la misma para ambos grupos de niños? De manera una variable independiente no son seguras; el efecto de esta
similar, puede haber errores en la interpretación de las variable independiente depende del nivel de la segunda
interacciones cuando el rendimiento en algunas condiciones variable independiente en el experimento multifactorial.
está limitado por los efectos techo y suelo.
7. Las pruebas de memoria implícita y explícita interactúan con
una variedad de variables independientes. Por ejemplo, aunque
4. Una cuestión crítica sobre cualquier resultado experimental es los amnésicos se desempeñan mal en las pruebas explícitas,
su generalización más allá de las condiciones en las que se como el recuerdo libre, muestran tanta preparación como los
descubrió. El modelo tetraédrico de experimentos de memoria sujetos de control en las pruebas implícitas, como la
de Jenkins proporciona cuatro dimensiones a través de las preparación en la identificación de palabras. Las imágenes
cuales se puede evaluar tal generalidad: (1) ¿Se mantendría producen mejor retención que las palabras en las pruebas de
el hallazgo con diferentes poblaciones de sujetos? (2) ¿Se memoria explícita, pero las palabras producen más preparación
obtendría el hallazgo con diferentes materiales experimentales? que las imágenes en las pruebas de memoria verbal implícita.
(3) ¿Ocurriría el hallazgo con diferentes tipos de pruebas de Al estudiar la forma en que estos tipos de pruebas interactúan
memoria? con otras variables, los científicos están obteniendo una nueva
(4) ¿Ocurrirían los mismos resultados con una diferente comprensión de la función de la memoria tanto normal como anorma
ÿ TÉRMINOS CLAVE
ÿ PREGUNTAS DE DISCUSIÓN
1. Identifique dos situaciones, además de las presentadas en el ¿Piensas en los descubrimientos científicos provocados por
capítulo, en las que los efectos techo y suelo probablemente un resultado anómalo cuando el conocimiento pasado no se
dificultarían la interpretación de las observaciones generalizó a una nueva situación?
experimentales. ¿Cómo podrían superarse en los experimentos 3. ¿Cuáles son las ventajas de los experimentos multifactoriales
los problemas causados por estos efectos? que los hacen tan populares entre los investigadores, a pesar
2. Los investigadores a menudo lamentan el descubrimiento de de su complejidad? Discuta la relación de los experimentos
que algún resultado no se generaliza a un nuevo entorno. multifactoriales con el problema de la generalidad de los
Discuta por qué las fallas en la generalización a menudo resultados.
CONEXIONES WEB
Un excelente sitio que cubre información básica sobre la memoria y cómo desarrollar una mejor memoria se puede
encontrar en:
http://www.muskingum.edu/~cal/database/general/memory.html
El sitio web del Practical Memory Institute incluye una lista de preguntas frecuentes (y respuestas) sobre la memoria.
Se puede encontrar en:
http://www.memoryzine.com/index.html
ÿ RECURSOS DE LABORATORIO
El capítulo 5 de Langston (2002) describe una tarea de memoria semántica: los sujetos recuperaron palabras para
definiciones como “un arco o un aro en el croquet por el que deben pasar las bolas” (la respuesta es wicket). De interés
fue la capacidad de realizar esta tarea con o sin gestos (algunos sujetos se vieron obligados a sostener una barra en
sus manos mientras que otros eran libres de gesticular si así lo deseaban). La hipótesis era que los gestos ayudan a
las personas a recuperar palabras. Lea estos experimentos y use el modelo de memoria de Jenkins para generar
variaciones experimentales.
PSICOLOGÍA EN ACCIÓN
1. ¿A qué hora del día escuchó por primera vez las noticias de los ataques del 11 de septiembre?
2. ¿Dónde estabas?
3. ¿Qué estabas haciendo?
4. ¿Quién te lo dijo?
5. ¿Quién más estaba allí?
6. ¿Cómo te sentiste al respecto?
7. ¿Puedes describir al menos tres detalles vívidos de la experiencia?
8. ¿Qué hizo inmediatamente después de escuchar la noticia?
Hágales estas preguntas a algunos de sus amigos también. Es muy probable que tanto usted como
sus amigos puedan responder con confianza al menos cinco de las preguntas, y que sus recuerdos de
escuchar las noticias del 11 de septiembre encajen en la categoría de recuerdos de memoria flash. Lo
sorprendente de los recuerdos de flash es su viveza; las personas informan que recuerdan detalles tan
periféricos como lo que vestían cuando escucharon las noticias. El término fue acuñado por Brown y Kulik
(1977) para describir los vívidos recuerdos de las personas al escuchar noticias impactantes. Eligieron el
término flashbulb porque “sugiere sorpresa, una iluminación indiscriminada y brevedad”.
Los llamados recuerdos de flash son recuerdos autobiográficos realmente vívidos y, como tales,
son tan propensos al error como otros recuerdos personales. Por ejemplo, Neisser y Harsch (1992)
encontraron cambios en la memoria de las personas al escuchar la noticia de la explosión del Chal·lenger
cuando compararon los informes iniciales con los recopilados 32 a 34 meses después. De los 36 sujetos,
solo 3 recordaron correctamente todos los atributos principales. Veintidós sujetos estaban equivocados en
dos de los tres principales atributos de la memoria (ubicación, actividad y fuente de noticias); los sujetos
restantes se equivocaron en los tres. Tales distorsiones de la memoria parecen desarrollarse con el
tiempo. Schmolck, Buffalo y Squire (2000) examinaron los recuerdos para escuchar el veredicto en el
juicio de OJ Simpson; 15 meses después del veredicto, el 50 por ciento de los informes se consideraron
altamente precisos (en comparación con las cuentas iniciales), mientras que después de 32 meses, solo
el 29 por ciento se etiquetaron como altamente precisos.
Hay muchas razones por las que estos recuerdos pueden distorsionarse con el tiempo.
La gente sigue hablando y pensando en los hechos mucho después de que hayan ocurrido. Dependiendo
de su audiencia o metas, pueden contar sus historias de manera diferente, con consecuencias para la
memoria (p. ej., Tversky y Marsh, 2000). Las personas también escuchan los relatos de otras personas, y
los oyentes pueden incorporar posteriormente detalles de las historias de otros en sus propios recuerdos
(p. ej., Niedzwienska, 2003). Las personas también tienen creencias acerca de cómo deberían haber sido
las cosas y pueden reconstruir sus recuerdos para que coincidan con esas creencias (p. ej., Ross, 1989).
Muchos psicólogos recopilaron recuerdos del 11 de septiembre inmediatamente después de los
ataques. Se están realizando estudios de seguimiento y se han publicado numerosos informes (p. ej.,
Luminet et al., 2004; Talarico & Rubin, 2003; Wolters & Goudsmit, 2005). Podría pensar en qué preguntas
sobre la memoria sería interesante hacer si tuviera acceso a la misma muestra de personas repetidamente
durante un período de años. ÿ
CAPÍTULO 11
PENSANDO
Y PROBLEMA
RESOLVIENDO
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: SESGO DE CONFIRMACIÓN
297
En caso de que no tengas ningún problema en este momento, déjanos darte uno. Lea atentamente el
siguiente problema y examine su representación en la figura 11.1. Piense bien en el problema antes de
continuar leyendo el texto.
Dos estaciones de tren están a 100 millas de distancia. A las 14:00 horas de un sábado por
la tarde, los dos trenes parten uno hacia el otro, uno de cada estación. Un tren viaja a 60
millas por hora, el otro a 40 millas por hora. Justo cuando los trenes salen de sus estaciones,
un pájaro salta en el aire frente al primer tren y vuela hacia el frente del segundo tren.
Cuando el pájaro alcanza el segundo tren, da la vuelta sin perder velocidad y vuela
directamente hacia el primer tren. El pájaro continúa volando de un lado a otro entre los
trenes a una velocidad de 80 millas por hora. ¿Cuántas millas habrá volado el ave antes de
que los trenes se encuentren?
¿Pudiste resolver el problema? La mayoría de la gente tiene mucha dificultad con él, pero algunas
personas lo resuelven casi de inmediato. Deben ser muy buenos matemáticos, podrías estar pensando.
De nada.
Consideremos cómo la mayoría de la gente trata de resolver este problema. Debido a la forma en
que se expresa y la forma en que se dibuja la imagen de la figura 11.1, la mayoría de las personas
comienzan a preocuparse de inmediato por cuánto tiempo le tomará al ave ir del primer al segundo tren,
qué distancia se habrá movido el segundo tren. para cuando llegue el pájaro, cuánto tiempo le llevará al
pájaro volver al primer tren y cuánto se habrá movido ese tren, y así sucesivamente. La estrategia general
es tratar de averiguar cuánto tiempo le tomará al pájaro hacer cada viaje entre los trenes, luego sumar
estos tiempos para averiguar cuántas millas habrá volado el pájaro antes de que los trenes se encuentren.
Esta es una estrategia bastante razonable y le dará la respuesta, siempre que tenga mucho tiempo, una
buena calculadora y conocimientos de cálculo.
Dado que es muy probable que no disponga de uno o más de estos tres recursos, es posible que
deba encontrar una solución más sencilla. El pensamiento se puede definir como “el logro de una nueva
representación a través de la realización de operaciones mentales” (Posner, 1973, p. 147). Podemos
decir que es necesario pensar para encontrar una solución más simple al problema del pájaro y el tren.
Para resolver el problema, debes reconceptualizarlo. De hecho, después de hacer una reconceptualización
adecuada, la solución al problema es simple.
En lo que debe concentrarse es en cuánto tiempo viajarán los trenes antes de encontrarse.
Como uno viaja a 60 millas por hora y el otro a 40 millas por hora y están separados por 100 millas, se
encontrarán en una hora. Una vez que piensas en reformular el problema de esta manera y usar otra
información, la solución es obvia. Dado que los trenes se encontrarán en una hora y el pájaro vuela a 80
millas por hora, el pájaro habrá volado 80 millas antes de que los trenes se encuentren. No se necesita
mucho tiempo; ni es una calculadora; ni las matemáticas superiores. Solo pensaba.
¿Solo pensaba? Eso es bastante simple de decir, pero el proceso es muy complicado.
¿Qué sucede mentalmente mientras una persona está tratando de encontrar una solución a un problema?
100 millas
Tren 1 – 60 mph Tren 2 – 40 mph
ÿ FIGURA 11.1
¿Cómo hace una persona para descubrir una solución más simple al problema (pensar)?
¿Podemos encontrar leyes psicológicas generales del pensamiento? ¿Cómo podemos siquiera
estudiar este proceso oculto? Estas son algunas de las preguntas difíciles que consideraremos en este
capítulo.
Los temas experimentales tratados en este capítulo incluyen el tema de la confiabilidad de los
resultados (o replicabilidad), el problema de las variables extrañas y el control experimental, y el
uso de informes verbales en la investigación psicológica. La primera preocupación es la confiabilidad
de los resultados: si realizáramos un experimento por segunda vez, ¿cuál sería la probabilidad de
obtener datos que nos permitieran llegar a la misma conclusión que en el primer experimento? Este
problema existe en toda investigación pero, por razones que se discutirán más adelante, puede
acentuarse en la investigación sobre el pensamiento y otros procesos complejos. En segundo lugar, el
tema de la resolución de problemas y el pensamiento es tan complicado que se necesita un gran
ingenio para realizar experimentos interesantes y útiles en esta área. ¿Cómo podemos obtener control
sobre alguna variable independiente mientras controlamos las variables extrañas, ya que hay tantas
que pueden influir en el proceso de pensamiento? El tema final es uno de informe subjetivo (verbal)
y su valor en la investigación psicológica. En un área como la resolución de problemas y el pensamiento,
la gente está bastante dispuesta, por lo general, a decir cómo piensan que se dedican a resolver un
problema. ¿Debemos aceptar sus informes como evidencia útil sobre la naturaleza de los procesos
involucrados?
Históricamente, ha habido dos enfoques principales para el estudio de la resolución de problemas
que tienen diferentes énfasis. Ambos han sido muy infl uyentes en el estudio del pensamiento y el
estudio del aprendizaje. Los dos enfoques representan un análisis de abajo hacia arriba (impulsado por
datos) y un análisis de arriba hacia abajo (impulsado por conceptos) análogos a las formas de examinar
la percepción que se discutieron en el Capítulo 7.
En su análisis del aprendizaje por ensayo y error, Thorndike se preocupó especialmente por
el éxito. Parecía obvio que el éxito de un movimiento correcto hacía que éste fuera impreso o
aprendido. El efecto del movimiento fue conducir al éxito, lo que "sella" el movimiento, como lo
expresó Thorndike. Estos primeros experimentos condujeron a la ley del efecto y al concepto de
reforzamiento (ver Capítulo 9). El impacto histórico de esta investigación ascendente ha sido
mucho mayor en el campo del aprendizaje animal, donde su importancia es abrumadora, que en
la investigación relacionada con el pensamiento y la resolución de problemas. El énfasis en la
investigación sobre el pensamiento humano y la resolución de problemas ha estado mucho más
en los procesos impulsados conceptualmente de alto nivel, en la tradición que se discutirá a
continuación. No obstante, ha habido intentos de analizar los procesos del pensamiento humano
en términos de aprendizaje por ensayo y error, o condicionamiento operante (ver Skinner, 1957, cap. 1
Razonamiento Analógico
Ilustraremos algunos puntos adicionales sobre la confiabilidad de la investigación discutiendo la
resolución de problemas por analogía. Cuando las personas comprenden algún punto por analogía,
entienden una cosa en términos de otra. Si te dijeran en física en la escuela secundaria que la estructura
del átomo era similar en algunos aspectos a la organización del sistema solar, o en química que las
moléculas de gas chocan entre sí como bolas de billar en una mesa de billar, o en psicología que la
memoria humana podría compararse con una biblioteca o diccionario gigante, tu maestro estaba
empleando un razonamiento analógico. Ella o él estaba tratando de hacerte entender algo desconocido
en términos de algo que ya entendías. Los psicólogos interesados en el pensamiento han reconocido
desde hace mucho tiempo la importancia de las analogías al pensar y hacer descubrimientos. El arte del
descubrimiento a menudo radica en percibir una semejanza entre dos elementos en diferentes dominios
de conocimiento.
y lo más obvio para medir es el número o proporción de las medidas de latencia no indican ninguna diferencia entre
sujetos en las dos condiciones que pueden resolver el los sujetos que resuelven problemas en dos condiciones,
problema dentro de un límite de tiempo (digamos, 45 los sujetos en una condición aún pueden lograr soluciones
minutos). Pero es probable que la mayoría de los problemas más satisfactorias que los sujetos en otra condición.
elegidos para el estudio sean bastante fáciles o al menos
solucionables dentro del límite de tiempo. ¿Qué pasa si Uno podría querer usar las tres medidas de solución
todos en ambos grupos resuelven el problema? Entonces de problemas como operaciones convergentes de algún
es imposible decir si la variable independiente tuvo algún constructo de resolución de problemas, pero es posible que
efecto, debido a un efecto techo en el desempeño (ver no haya una relación directa entre ellas. Por ejemplo, los
Capítulo 10). Por supuesto, es incorrecto concluir que la sujetos en una condición pueden tardar mucho más en
variable no tuvo efecto solo porque el porcentaje de personas resolver un problema en particular que los sujetos en otra
que resolvieron el problema es equivalente, ya que el condición, y quizás un porcentaje menor de sujetos resolverá
problema era demasiado fácil para revelar posibles el problema en la primera condición, pero las soluciones que
diferencias. Lo que podemos hacer es observar una segunda los sujetos logran en esta condición pueden ser superiores
medida de rendimiento para resolver el problema: la latencia, a los del otro. En otras palabras, la variación en la variable
o el tiempo que lleva resolver el problema. Aunque todos los independiente podría permitir que los sujetos en una
sujetos de ambos grupos resolvieron el problema, es posible condición produzcan con frecuencia una solución deficiente
que se hayan tomado diferentes cantidades de tiempo para en un período relativamente corto, a diferencia de los sujetos
hacerlo en las diferentes condiciones. Entonces, aunque en otra condición que pueden producir una mejor solución
puede que no haya diferencias en los porcentajes de con menos frecuencia y tardar más tiempo en hacerlo. . Así
personas que resuelven el problema, la medición del tiempo que puede que no haya una relación simple entre las
necesario para resolver el problema puede resultar un índice medidas. Este problema es una variante del problema de
más sensible de la dificultad del problema en las dos equilibrio entre velocidad y precisión analizado en las
condiciones (imagen versus sin imagen). De hecho, incluso medidas del tiempo de reacción en el Capítulo 8.
si no hubiera un efecto de techo, pero los porcentajes de
personas que resolvieron el problema aún fueran equivalentes
a, digamos, 60 por ciento, las latencias aún podrían revelar
diferencias en el rendimiento. Variables independientes
Por lo tanto, podemos decir que es probable que las latencias La principal variable independiente en el estudio de la
sean una variable dependiente más sensible que el resolución de problemas es la forma en que se presenta el
porcentaje correcto, ya que es más probable que esta problema. Esto se puede variar de varias maneras diferentes.
medida indique un efecto de la variable independiente en la Consideremos el problema de cuánto tarda el pájaro en
mayoría de las situaciones. (Sería muy inusual encontrar lo volar entre los dos trenes antes de que se encuentren, que
contrario: un efecto sobre el porcentaje correcto pero no se presentó al principio del capítulo.
sobre la latencia). Por supuesto, normalmente esperaríamos
una alta correlación negativa entre el porcentaje correcto y Una cosa que podríamos variar es el orden y prominencia
la latencia. de la información necesaria para resolver el problema.
problema. El hecho crítico de que el pájaro volaba a para resolver el problema; si la magnitud de la
80 millas por hora está oculto en la descripción del recompensa ofrecida afecta la solución; y si existen
problema. Si se hiciera más prominente, los sujetos diferencias individuales entre las clases de personas
podrían tener la idea de usar este hecho antes en sus (p. ej., CI alto versus bajo) para resolver el problema.
intentos de reestructurar el problema. Un segundo
factor que puede variar es la cantidad de información
irrelevante presentada. Por ejemplo, la información de Variables de control
que los trenes comenzaron a las 2:00 p . m. de un
sábado es completamente irrelevante para resolver el Los experimentos relacionados con la resolución de
problema y debe ignorarse. Bien puede ser que cuanta problemas y el pensamiento suelen ser más
más información irrelevante se presente junto con los complicados que otros en la psicología experimental
pocos hechos relevantes, más tiempo llevará resolver humana; por lo tanto, esta área (junto con otras, como
el problema. Si se presenta o no una ilustración y la la psicología social y ambiental, que se ocupan de
naturaleza de la ilustración también podría variar. procesos complejos) requiere mucho cuidado para
Presentar o no presentar una ilustración con el producir control experimental. Dado que es típico en
problema puede ayudar o dificultar su solución, este campo el uso de diseños entre sujetos (se asignan
dependiendo de la naturaleza del problema. También grupos de sujetos independientes a diferentes
podrían estudiarse otros tipos de variables condiciones), se debe tener cuidado para asegurar
psicolingüísticas, como si se usan oraciones activas o que los sujetos en las diferentes condiciones sean
pasivas para describir el problema. Además de estadísticamente equivalentes, ya sea asignándolos
aquellas relacionadas con la forma en que se presenta aleatoriamente a las condiciones o comparándolas en
el problema, otras variables de interés podrían ser si alguna dimensión como el coeficiente intelectual. De
existe presión de tiempo (o algún otro tipo de estrés) manera similar, uno debe controlar tan estrictamente
bajo el cual las personas están trabajando cuando como sea posible todas las variables extrañas (como
intentan solucionarlo. la forma en que se plantea el problema o cómo se presenta).
(Hadamard, 1945). Por ejemplo, en el siglo XVII, William Harvey desarrolló un modelo hidráulico de
circulación sanguínea después de concebir el corazón como una bomba.
El estudio del razonamiento por analogía es bastante difícil. La resolución de problemas, el
pensamiento y el descubrimiento son temas que durante mucho tiempo se han resistido a comprender
por parte de los psicólogos. Sin embargo, en los últimos 20 años más o menos, se han logrado avances
reales en esta área en numerosos frentes (Mayer, 1983). Aquí consideramos ejemplos de experimentos
de Gick y Holy Oak (1980, 1983) para ilustrar cómo se puede realizar una investigación interesante
sobre estos temas y mostrar la importancia de determinar la confiabilidad de los fenómenos experimentales.
Gick y Holyoak estaban interesados en los efectos del razonamiento analógico en la resolución
de problemas. Antes de discutir esta investigación, le daremos el problema que usaron, para que pueda
reflexionar sobre él antes de continuar. Se llama el problema de la radiación y fue utilizado por primera
vez por Duncker en 1945. Puede enunciarse de la siguiente manera:
Supongamos que usted es un médico que se enfrenta a un paciente que tiene un tumor maligno en el estómago.
Es imposible operar el tumor, pero a menos que se destruya el tumor, el paciente morirá. Hay una especie de
rayo que se puede usar para destruir el tumor. Si los rayos alcanzan el tumor todos a la vez con una intensidad
suficientemente alta, el tumor se destruirá. Desafortunadamente, a esta intensidad también se destruirá el tejido
sano por el que pasan los rayos en su camino hacia el tumor. A intensidades más bajas, los rayos son inofensivos
para el tejido sano, pero tampoco afectarán al tumor. ¿Qué tipo de procedimiento podría usarse para destruir el
tumor con los rayos y al mismo tiempo evitar destruir el tejido sano? (Gick & Holyoak, 1980, págs. 307–308).
Gick y Holyoak (1980, 1983) estaban interesados en ver si podían lograr que más personas
resolvieran este problema dándoles un problema y una solución análogos antes del problema de la
radiación. La idea es que las personas abstraigan el principio rector del primer problema y luego
puedan aplicarlo al segundo. Con esto en mente, Gick y Holyoak desarrollaron otras “historias análogas”
que incorporaban el mismo principio que se aplicaba a la solución más efectiva al problema de la
radiación.
En una historia, llamada "El Comandante", el líder de un cuerpo de tanques necesitaba montar un
ataque contra un cuartel general enemigo. Al atacar con muchos tanques, tenía buenas posibilidades
de ganar, pero tenía que atacar a través de puentes angostos y desvencijados que solo permitirían el
paso de unos pocos tanques. Un asalto con una fuerza tan pequeña a través de un puente sería
fácilmente repelido. Para lograr la victoria, el comandante del tanque ideó el plan de enviar algunos
tanques a cada uno de los pequeños puentes que rodeaban el cuartel general. Todos los tanques
pudieron atacar a través de los puentes a la vez y alcanzar el cuartel general enemigo.
La similitud entre el problema del ataque con tanques y el problema de la radiación debería ser
evidente. En ambos casos, es necesario que el solucionador de problemas renuncie a un ataque
directo a la sede (o tumor canceroso) y disperse fuerzas (o radiación) para un ataque convergente
simultáneo desde diferentes direcciones. Pero, ¿utilizarían los sujetos de un experimento los principios
derivados de la lectura de una historia como “El Comandante” para resolver el problema de la radiación?
Gick y Holyoak (1980) realizaron una serie de experimentos en los que los sujetos intentaron resolver
el problema de la radiación después de leer una historia similar a “El Comandante” o después de no
leer ninguna historia (o una historia irrelevante). Descubrieron en varios experimentos que los sujetos
a los que no se les dio una historia o una historia irrelevante antes del problema de la radiación
resolvieron el problema con la solución más efectiva solo alrededor del 10 por ciento de las veces. Sin
embargo, cuando a los sujetos se les dio una historia análoga antes del problema de la radiación,
alrededor del 75 por ciento lo resolvió dentro del límite de tiempo. Dado que este resultado se obtuvo
en varios experimentos, el fenómeno básico se repitió varias veces. Obviamente, las personas pueden
beneficiarse de la analogía para resolver problemas.
Los resultados de uno de sus experimentos llevaron a Gick y Holyoak (1980) a considerar más de
cerca los procesos involucrados en el razonamiento por analogía. En el experimento 4 de su serie, les
dieron a todos los sujetos la historia analógica para leer y luego el problema de la radiación para
resolver. Sin embargo, en la condición de "pista" del experimento 4, se les dijo a los sujetos, después de
.25
.20
Proporciones
sujetos
que
de
proporcionadas
convergencia
Soluciones
de
.15
.10
.05
hacer analogías entre eventos políticos y líderes (Holyoak & Thagard, 1997). Una nueva línea
creativa de investigación está investigando cómo las analogías concretas ayudan a las personas a
comprender conceptos abstractos (Boroditsky, 2000). Por ejemplo, considere cómo habla sobre el
tiempo: toma prestados términos espaciales como "adelante", "adelante" y "detrás". Es decir, usas
tu experiencia personal con el espacio físico como una analogía para hablar y pensar sobre el tiempo
(que en realidad no puedes ver ni tocar). En una serie de ingeniosos experimentos, Boroditsky y
Ramscar (2002) demostraron cómo las posiciones físicas de las personas afectaban sus respuestas
a las preguntas sobre el tiempo. Hicieron a las personas la pregunta ambigua: “Suponga que le
dicen que la reunión del próximo miércoles se ha adelantado 2 días. ¿Qué día es la reunión, ahora
que ha sido reprogramada? Dependiendo de su perspectiva, podría responder razonablemente
"lunes" o "viernes" (la mayoría de las personas confían mucho en su respuesta, pero pregúntele a
algunos de sus amigos: ¡encontrará que las personas responden esta pregunta de manera diferente!).
Tu respuesta depende de cómo pienses sobre el tiempo. Si ve el tiempo moviéndose hacia usted (la
perspectiva del tiempo moviéndose), entonces pensará en el tiempo avanzando (adelantándose) 2
días más cerca y responderá "Lunes". Si te ves a ti mismo moviéndose a través del tiempo (la
perspectiva del movimiento del ego), "adelante" implica tu movimiento hacia el futuro, y responderás
"viernes".
Boroditsky y Ramscar (2002) hicieron esta pregunta a las personas en el aeropuerto. Como era de
esperar debido a la naturaleza ambigua de la pregunta, la mitad de las personas que esperaban
para recoger a los pasajeros respondieron “viernes” y la mitad respondió “lunes”. Pero más de la
mitad de los pasajeros de líneas aéreas (personas que estaban esperando para subirse a un avión
o que acababan de bajarse de un avión) eligieron "viernes", porque los viajeros aéreos estaban en
el modo de pensar en sí mismos como moviéndose, como viajando a través físico. espacio, y así
usó la perspectiva espacial del movimiento del ego para responder a la pregunta temporal. Boroditsky
Considere los mapeos estructurales ilustrados en la Figura 11.4. Holyoak asume que si la
relación percibida de un par de elementos en los dos problemas es consistente, entonces las
relaciones entre otros elementos también tienen que ser consistentes. Si el solucionador de
problemas nota la analogía entre la fortaleza y el tumor, entonces capturar tendría que corresponder
a destruir, y el destructor (rayos) tendría que mapear al capturador, que sería el ejército en este
caso. El patrón de tales mapeos analógicos sería estructuralmente consistente.
Las correspondencias entre los componentes de los dos problemas que se muestran en la
figura 11.4 forman un conjunto coherente y, por lo tanto, se apoyan entre sí. Por ejemplo, si una
persona reconoce primero un punto de correspondencia (digamos, ejército es lo mismo que rayos),
entonces es más probable que la persona note otra correspondencia, como entre general y médico.
Holyoak cree que su teoría de la consistencia estructural ayuda a especificar las condiciones bajo
las cuales las soluciones análogas son fáciles o difíciles. Si una persona es capaz de reconocer uno
o dos mapeos, entonces las otras consistencias encajarán y el problema debería resolverse.
ÿ FIGURA 11.4
El tema del control experimental se desarrolla a lo largo de este libro, como debería ser, ya que es
crucial para todos los tipos de investigación experimental. El propósito de cualquier experimento es
observar el efecto de la manipulación de ciertas variables —las variables independientes— sobre la
medición de las variables dependientes. Para que una conclusión sobre el efecto de una variable
independiente sobre una variable dependiente sea sólida, es necesario que obtengamos una
cantidad suficiente de control experimental sobre la situación para asegurar que ningún otro factor
varíe con la variable independiente. En este libro, estas otras variables se denominan generalmente
variables de control, aunque también se denominan variables extrañas o incluso variables molestas.
Si se permite que una variable extraña varíe al mismo tiempo que la variable independiente de
interés, no podemos saber si el efecto sobre la variable dependiente es causado por la variación en
la variable independiente, la variable extraña o ambas operando juntas. En tales casos, decimos que
las dos variables se confunden.
En el estudio de procesos complejos, a menudo hay mayores problemas de control
experimental que en otros tipos de investigación. En el estudio de temas como la resolución de
problemas, con frecuencia hay una gran variación en las medidas tomadas sobre la variable
dependiente. Ya hemos discutido algunas de las razones de esto. Debido a que es necesario utilizar
diseños entre sujetos en gran parte de esta investigación, las diferencias individuales entre los
sujetos contribuyen en gran medida a la variación no controlada o “varianza del error”.
Además, puede que no sea posible controlar estrictamente todas las variables molestas que pueden
afectar una situación. En su lugar, se puede dejar que varíen de forma no sistemática, ya que la
variación no sistemática no afectará a una condición experimental más que a otra. Aún así, estos
factores que varían aleatoriamente pueden servir para aumentar la variabilidad de las mediciones.
Debido al efecto de estas variaciones sobre la variable dependiente, puede ser más difícil
detectar un efecto confiable de la variable independiente. Entonces, otra razón para el control
experimental es reducir estas fuentes extrañas de variación en
En este experimento era necesario un diseño entre sujetos, ya que una vez que los sujetos habían
estado expuestos al problema, no podían, por razones obvias, volver a ser evaluados en una condición
diferente. En este experimento en particular, Duncker empleó solo siete sujetos en cada condición. Los
resultados para las tres condiciones se reportan en la Tabla 11.1 como el número de sujetos que resolvieron
el problema en cada condición. Los siete sujetos en la condición de control resolvieron el problema, pero
solo el 43 por ciento de los sujetos en la condición de fijeza funcional (tres de siete) pudieron hacerlo. En
la condición de uso neutral, solo un sujeto (14 por ciento) pudo resolver el
Problema resuelto
Condición Cajas (n 21)
problema. Por supuesto, estas diferencias entre las condiciones no se evaluaron estadísticamente,
pero la diferencia entre las condiciones de control y de fijeza funcional se replicó con otros cuatro
problemas. La diferencia entre las condiciones de fijación funcional y de uso neutral se replicó con
dos grupos independientes que resolvieron otro problema. Desde entonces, el efecto de la fijeza
funcional se ha replicado varias veces, por lo que podemos estar seguros de que es fiable, a pesar
del pequeño número de sujetos utilizados en los estudios originales.
Los hallazgos de Duncker pueden interpretarse dentro del marco de los principios de
resolución de problemas de la Gestalt, discutidos anteriormente en este capítulo. Recuerde que
los gestaltistas creían que muchos problemas se resuelven a través de la intuición, o una
reestructuración repentina del problema de manera que conduzca a la solución correcta. En el
experimento de Duncker, los sujetos en la condición de fijeza funcional parecían incapaces de
superar el sesgo inducido al ver que todos los objetos cumplían sus funciones ordinarias y no
podían reestructurar sus percepciones para ver diferentes usos de los objetos.
Réplica de Adamson
Un estudio de Adamson (1952) es interesante al respecto. Trató de replicar el experimento original
de Duncker comparando sujetos en las condiciones de fijeza funcional y control en la solución de
tres problemas. Estos incluían el problema de la caja que ya hemos discutido, así como otros dos,
conocidos como el problema del sujetapapeles y el problema del gimlet. (La naturaleza exacta de
estos problemas no tiene por qué preocuparnos.) En cada situación, la comparación se realizó
entre sujetos que tenían experiencia previa con un objeto (y que, por lo tanto, deberían haber
estado pensando en la función del objeto como algo fijo) y sujetos de control. para quien este no
fue el caso. Adamson estaba principalmente preocupado por la cantidad de sujetos que se
utilizaron en el experimento original de Duncker, por lo que utilizó entre 26 y 29 sujetos en cada
una de sus seis condiciones separadas (3 problemas, 2 condiciones experimentales). Las medidas
dependientes que usó fueron el porcentaje de sujetos que pudieron resolver el problema en el
período de 20 minutos y la cantidad de tiempo que les tomó a los sujetos exitosos resolver el
problema.
Los resultados son bastante instructivos. Cuando Adamson usó la medida dependiente de
Duncker del porcentaje de sujetos que pudieron resolver el problema, pudo
250
200
segundos
en
150
problema
solución
Latencia
media
del
de
la
100
50
0
Control Experimental Control Experimental
(fijeza funcional) (fijeza funcional)
ÿ FIGURA 11.5
Tiempo necesario para resolver los problemas de la barrena y el clip en las condiciones de
control y experimentales (fijación funcional) del experimento de Adamson (1952). Los sujetos en
la condición de fijeza funcional tardaron más en resolver los problemas que los controles.
A pesar del éxito del conductismo en barrer con el enfoque estructural, el uso del informe
subjetivo ha mantenido su lugar en la psicología. De hecho, el uso del informe verbal está muy de
acuerdo con las reglas científicas de los conductistas, ya que los informes verbales son, por supuesto,
un comportamiento manifiesto. De hecho, Watson, el fundador del conductismo, lo afirma claramente
en una sección llamada “La plataforma del conductista” en Behaviorism:
El conductista pregunta: ¿Por qué no hacemos de lo que podemos observar el campo real de la
psicología? Limitémonos a las cosas que se pueden observar y formulemos leyes que se refieran
sólo a esas cosas. Ahora, ¿qué podemos observar? Podemos observar el comportamiento, lo
que el organismo hace o dice. Y señalemos de una vez: ese decir es hacer, es decir, comportarse.
Hablar abiertamente o para nosotros mismos (pensar) es un tipo de comportamiento tan objetivo
como el béisbol. (1925, p. 6; las cursivas son de Watson)
El uso del informe verbal, entonces, fue respaldado por el fundador del conductismo. Pero como
señaló Spence (1948), el uso del informe verbal es muy diferente para los psicólogos estructuralistas
y conductistas. Para los primeros, los informes introspectivos son hechos o datos sobre eventos
mentales internos que se piensa que reflejan directamente estos eventos. Para los conductistas, por
otro lado, los informes verbales son simplemente un tipo de comportamiento que puede valer la pena
estudiar como variable dependiente. Deben considerarse ni más ni menos valiosas o “reales” a priori
que cualquier otro tipo de respuesta o variable dependiente (ver Capítulo 7). Si uno quiere usar
informes verbales como evidencia para alguna construcción mental particular, deben ser considerados
como solo una de varias operaciones convergentes necesarias. Los informes verbales, por supuesto,
tienen más probabilidades de ser útiles en ciertas áreas de la psicología que en otras. La investigación
sobre el pensamiento es un área en la que se hace un uso extensivo de los informes verbales.
Un componente crítico en el pensamiento es la capacidad de evaluar el conocimiento propio.
Varios experimentos han explorado el fenómeno de la sensación de saber , primero estudiado
sistemáticamente por Hart (1965). Un experimento representativo es el de Freedman y Landauer
(1966). A los sujetos se les dio una larga serie de preguntas de conocimiento general (¿Cuál es la
capital de Ecuador? ¿Quién fue el quinto presidente de los Estados Unidos?) y se les pidió que
proporcionaran respuestas. Para cada pregunta para la que los sujetos no podían dar una respuesta,
se les pidió que calificaran en una escala de cuatro puntos qué tan seguros estaban de poder
reconocer la respuesta si se les presentaran alternativas similares. Los cuatro juicios fueron
"definitivamente sabe" la respuesta, "probablemente sabe", "probablemente no sabe" y "definitivamente
no sabe". Después de hacer estos juicios sobre la sensación de saber, se les volvieron a dar las
preguntas a los sujetos y se les pidió que eligieran la respuesta correcta entre seis alternativas.
Los sujetos reconocieron el 73 por ciento de los ítems que habían juzgado que definitivamente
sabrían, el 61 por ciento dijeron que probablemente sabrían, y el 51 por ciento y el 35 por ciento de
las respuestas a las preguntas pensaron que probablemente o definitivamente no sabían. saber. El
hecho de que las calificaciones se correlacionen generalmente con el rendimiento de reconocimiento
posterior puede tomarse como una indicación de que los sentimientos subjetivos de las personas
sobre lo que saben (después de una falla en la memoria) son bastante precisos. Otro
Estos estudios muestran que aunque los informes verbales de nuestro conocimiento fáctico están
generalmente correlacionados con ese conocimiento, de ninguna manera son reflejos perfectos de lo
que sabemos. Esto señala una deficiencia de los informes verbales retrospectivos de los procesos
cognitivos. Los caprichos de la memoria pueden producir un juicio inexacto o sesgado de lo que
pensamos mientras realizamos algún acto. Muchos factores (motivacionales, emocionales, sociales)
pueden disminuir la precisión de los informes verbales. De hecho, los investigadores en algunas áreas
han sido recelosos durante mucho tiempo de aceptar informes verbales al pie de la letra.
Nisbett y Wilson (1977) revisaron muchos experimentos que relacionaban los informes verbales
de los individuos con su comportamiento en situaciones experimentales y llegaron a la sorprendente
conclusión de que "puede haber poca o ninguna conciencia introspectiva directa de los procesos
cognitivos de orden superior" (p. 231). . Usaron muchas líneas de evidencia para llegar a esta
conclusión; un tipo general implica experimentos que comparan el rendimiento de las personas entre
diseños de sujetos. Se manipula alguna variable experimental y se demuestra que tiene una fuerte
influencia en el comportamiento; más tarde, se pregunta a los sujetos de los diferentes grupos por qué
respondieron de la forma en que lo hicieron. Si los sujetos son conscientes de las fuerzas que guían su
comportamiento, deberían reportar la infl uencia de la variable independiente como un determinante
crítico de su desempeño. En muchos casos revisados por Nisbett y Wilson, los sujetos no podían hacer
esto y, además, a menudo negaban que la variable independiente pudiera haberlos afectado, incluso
cuando el experimentador lo sugería como una posibilidad.
Nisbett y Wilson (1977) utilizaron dichos informes como base para su afirmación de que las
personas no tienen acceso introspectivo directo a los procesos cognitivos que median el comportamiento
Un corolario de esta posición parecería ser que los informes subjetivos son generalmente inexactos
como descripciones de eventos cognitivos. (Nisbett y Wilson argumentan que aun cuando
Muchos escritores sobre el tema del pensamiento y la resolución de problemas han descrito un proceso
bastante misterioso que parece ayudar en la resolución de problemas. Considere el siguiente relato del
matemático francés Henri Poincaré. (Los términos matemáticos de la cita no deben desanimarlo;
simplemente examine el pasaje para conocer el principio psicológico involucrado).
Justo en ese momento dejé Caen, donde vivía entonces, para emprender una excursión
geológica bajo los auspicios de la escuela de minas. Los cambios de viaje me hicieron olvidar
mi trabajo matemático. Habiendo llegado a Coutances, subimos a un ómnibus para ir a un
lugar u otro. En el momento en que puse el pie en el peldaño me vino la idea, sin que nada en
mis pensamientos anteriores pareciera haberme allanado el camino, que las transformaciones
que había utilizado para definir las funciones de Fuchsian eran idénticas a las de geometría
no euclidiana. No verifiqué la idea; No tendría tiempo, pues al tomar asiento en el ómnibus
continué con una conversación ya iniciada, pero sentí una certeza perfecta. A mi regreso a
Caen, por motivos de conciencia, verifiqué el resultado en mi tiempo libre.
Además, cuanto más larga sea la pausa, más probable es que los sujetos encuentren
la solución (y más rápido), al menos hasta cierto límite.
Quedan, como siempre, una serie de consideraciones a las que debemos dirigir
nuestra atención. ¿Cuánto tiempo debemos permitir que los sujetos resuelvan el
problema? Podrían ser apropiados dos períodos de 15 minutos, o un total de 30 minutos.
La variable independiente primaria es el retraso que se va a introducir entre los dos
periodos de trabajo sobre el problema. Como mínimo, querríamos tres condiciones
independientes, por lo que los retrasos apropiados podrían ser de 0, 15 o 30 minutos
entre los dos períodos de trabajo. (También podrían ser apropiadas más condiciones
con una gama más amplia de intervalos de demora). El experimento probablemente
debería emplear un diseño entre sujetos, ya que la cantidad de tiempo requerida para
que los sujetos cumplan las tres condiciones sería prohibitiva. El número de sujetos a
servir en cada condición dependería de los recursos disponibles pero debería ser el
mayor posible. Un mínimo de 20 puede ser suficiente, pero el poder de las pruebas
estadísticas basadas en una muestra tan pequeña no sería muy grande. Sería mucho
mejor tener 75 o 100 sujetos por condición. Dado que se podrían evaluar grupos de
sujetos en lugar de individuos, la cantidad de esfuerzo en evaluar a 300 sujetos no sería
prohibitivo, si hubiera tanta gente disponible. La duración de todo el procedimiento
variaría desde quizás 45 minutos en la condición de retraso cero hasta 75 minutos en la
condición de retraso de 30 minutos.
Un hombre tenía cuatro cadenas, cada una de tres eslabones. Quería unir las cuatro
cadenas en una sola cadena cerrada. Tener un enlace abierto cuesta 2 centavos y
tener un enlace cerrado cuesta 3 centavos. El hombre tenía sus cadenas unidas en
una cadena cerrada por 15 centavos. ¿Cómo lo hizo?
Otra consideración es lo que deberían estar haciendo los sujetos durante los intervalos de
demora. No se les debe permitir simplemente sentarse allí y reflexionar sobre el problema, ya
que entonces esencialmente no se les da ningún retraso. Los sujetos deben estar ocupados
con problemas de aritmética mental o similares; incluso podría ser prudente hacerles creer, al
comienzo de la pausa, que van a pasar a una nueva fase del experimento y que no volverán
al problema que no lograron resolver. Esto aseguraría que los sujetos no estén tratando de
prestar atención al problema mientras trabajan en la actividad de relleno.
ÿ RESUMEN
1. Los estudios de procesos psicológicos complejos, como el repita el experimento lo más exactamente posible para ver si
pensamiento y la resolución de problemas, tienen problemas se obtienen los mismos resultados un segundo
especiales en términos de confiabilidad de los resultados y segunda vez Las replicaciones sistemáticas implican cambiar
control experimental. Un problema principal tiene que ver con variables que no se consideran críticas para el fenómeno bajo
la variabilidad relativamente grande que es probable que consideración para asegurarse de que sobreviva.
ocurra en las observaciones bajo diferentes condiciones tales cambios. Las réplicas conceptuales intentan demostrar
experimentales. Las diferencias individuales que muestran las el fenómeno con un paradigma o conjunto de condiciones
personas al realizar una tarea compleja, como resolver un experimentales completamente nuevo.
problema, tienden a ser mucho mayores que al realizar tareas 5. Las réplicas sistemáticas y conceptuales también abordan la
más simples. generalidad de los resultados. ¿Se generalizan los resultados
2. En experimentos complejos, a menudo es necesario utilizar de un experimento a través de los cambios más bien leves en
diseños entre sujetos, en los que un grupo independiente de el procedimiento de las réplicas sistemáticas y los mayores
sujetos sirve en cada condición experimental. cambios en el procedimiento de las réplicas conceptuales? A
Desafortunadamente, es posible un menor control sobre la menudo, los avances en la comprensión de un fenómeno
varianza introducida por las diferencias entre sujetos que en mejoran cuando los investigadores pueden encontrar condicione
los diseños dentro de los sujetos. Una solución parcial a estos que el fenómeno no se replica. Cuando se establecen tales
problemas es obtener tantas observaciones por condición condiciones límite y el investigador comprende qué factores
como sea posible para producir resultados estables y controlar controlan la presencia o ausencia del fenómeno, se pueden
tan estrictamente como sea posible todas las variables construir mejores teorías.
extrañas, para que no aumenten la variabilidad dentro de las
condiciones. 6. Los informes subjetivos son informes verbales sobre la
3. La confiabilidad de los resultados de un solo experimento puede conciencia de las personas sobre sus procesos cognitivos. A
evaluarse a través de la lógica de la inferencia estadística veces se utilizan en el estudio del pensamiento, pero se debe
mediante el empleo de pruebas estadísticas apropiadas. tener precaución. En algunos casos, las personas confían
Estas pruebas nos permiten evaluar qué tan probable es que demasiado en los juicios sobre su conocimiento. En
el efecto de alguna variable experimental sea realmente experimentos sobre varios juicios complejos, las personas
causado por la operación de esa variable y no por factores proporcionaron impresiones subjetivas erróneas con respecto
aleatorios (casuales). a la infl uencia de variables particulares que demostraron
4. La confiabilidad experimental, que muchos psicólogos prefieren controlar realmente su comportamiento. Los informes verbales
a la confiabilidad estadística, se refiere a la replicabilidad real a veces son útiles en la investigación psicológica, pero es
de los experimentos. Se identifican tres tipos. En las réplicas probable que su confiabilidad varíe según el tema que se
directas, el intento es estudie.
ÿ TÉRMINOS CLAVE
hipótesis nula
ÿ PREGUNTAS DE DISCUSIÓN
1. Un investigador del departamento de biología de su universidad ción), le preguntamos al experimentador cuántas de las ratas
acaba de demostrar la percepción extrasensorial (ESP) en puntuaron por debajo del azar en un 10 por ciento o más.
ratas. Las ratas se colocaron en un laberinto, donde debían El investigador informa que tres lo hicieron y dice estar fascinado
elegir entre dos posibles caminos, uno de los cuales conducía a por este descubrimiento, que parece indicar que algunas ratas
la comida. Las ratas no podían ver ni oler la comida en el lugar tienen una “percepción extrasensorial negativa”. ¿Qué concluye
del laberinto donde tenían que tomar su decisión, y la pista en usted, como observador desapasionado, acerca de estas
la que el experimentador colocaba la comida variaba afirmaciones?
aleatoriamente de una prueba a otra. A lo largo de una serie de 3. Distinguir entre réplicas directas, réplicas sistemáticas y réplicas
50 pruebas, el investigador encontró que había 2 ratas de 100 conceptuales. ¿Deberían considerarse los tres tipos
probadas que parecían funcionar mejor de lo que cabría esperar cualitativamente diferentes, o se encuentran en un continuo? Si
sobre la base del azar. se encuentran en un continuo, ¿qué dimensión subyace?
Uno escogió la pista correcta el 64 por ciento de las veces; el 4. El sistema de recompensas en la ciencia desalienta las réplicas
otro lo eligió el 66 por ciento de las veces (con una probabilidad del trabajo de otras personas. Los investigadores son mucho
del 50 por ciento). ¿Cuál de las dos pruebas siguientes sería más recompensados por contribuciones novedosas que por
más convincente para usted como confirmación de que estas “simplemente repitiendo” el trabajo de otros. Algunos han
ratas tienen PES? una. El investigador realiza pruebas argumentado que este sistema de recompensas tiende a crear
estadísticas que muestran que las dos ratas se habían fragmentación y desorden en muchas áreas de la psicología,
desempeñado mejor que el azar al tomar sus decisiones; o porque las personas son recompensadas por seguir su propio
camino y (a veces) ignorar el progreso en otras áreas
b. un investigador diferente prueba las dos ratas en sev estrechamente relacionadas. Por lo tanto, los fenómenos
eral cien ensayos más y tiene éxito en básicos a menudo no se replicarán. ¿Cree que la replicación
replicando los hallazgos del primer investigador. debería fomentarse con más fuerza? ¿Si es así, cómo?
Defiende tu elección. Si usted fuera el segundo investigador,
5. Muchas revistas psicológicas alientan a los investigadores
¿qué salvaguardas introduciría en el experimento para
a informar sobre una serie de experimentos sobre algún
asegurarse de que las ratas no usaran señales sensoriales para
fenómeno en lugar de un solo experimento. ¿Crees que
resolver el problema (suponiendo que las ratas se desempeñaron
es buena idea? Si es así, ¿por qué? ¿Qué peligros podrían
nuevamente por encima del azar)?
ser inherentes al requerir que los informes de investigación
2. Después de ver los resultados del primer experimento (es decir,
contengan numerosos experimentos?
2 de cada 100 ratas aparentemente puntuaron mejor que el
azar en la prueba de percepción extrasensorial).
en algunas áreas de la psicología que en otras. Para C. Estudiar los procesos mentales de las personas que ocurren
cada uno de los siguientes temas, discuta las ventajas y cuando deciden comprar un producto en lugar de otro.
desventajas de usar informes verbales. Para aquellos
casos en los que crea que no se pueden utilizar informes d. Estudiar las razones por las que a una persona le gusta un
verbales, sugiera mejores métodos: otro
una. Estudiar estrategias mediante las cuales las personas mi. Estudiar qué factores afectan a las ilusiones visuales
recuerdan sus experiencias de la infancia cuando se les pide
que lo hagan.
CONEXIONES WEB
El siguiente sitio web tiene enlaces a muchos acertijos clásicos de resolución de problemas, incluido
el dilema del prisionero:
http://www.psychnet-uk.com/games/games.htm
El siguiente sitio web tiene enlaces a diferentes demostraciones y estudios de resolución de problemas:
http://psych.hanover.edu/research/exponnet.html#Cognición
PSICOLOGÍA EN ACCIÓN
Sesgo de confirmación
Considere el siguiente problema: Cada una de las siguientes tarjetas tiene dos caras; por un lado hay
una letra y por el otro un número. Tu tarea es averiguar qué cartas deben darse vuelta para probar la
siguiente regla: "Si una carta tiene una vocal en un lado, tiene un número par en el otro".
A GRAMO 4 7
¿Qué tarjeta(s) eligió? La mayoría de las personas eligen solo la carta A o las cartas A y 4. Pero en
realidad, debe seleccionar las cartas A y 7, ya que ambas cartas le permitirán refutar la hipótesis (si
el 7 tiene una vocal en el otro lado, o si la carta A se convierte en un número impar, entonces la regla
debe ser falsa (la verificación de la carta 4 solo le permitirá confirmar la hipótesis). Esta tarea es la
clásica Tarea de Selección de Cartas de Wason (p. ej., Wason, 1968), y el sesgo de confirmación
es el nombre que se le da a la tendencia de las personas a buscar evidencia que respalde su hipótesis.
A las personas les va mejor en esta tarea cuando la tarea se conceptualiza dentro de un dominio
más familiar; por ejemplo, saben qué cartas dar la vuelta para probar la regla: “para beber alcohol hay
que tener al menos 21 años” (una carta tiene una edad por un lado y una bebida por el otro).
Ahora, la gente no se molesta en revisar las bebidas de los jóvenes de 21 años (porque no
importa para la regla); saben que necesitan ver qué edad tienen los bebedores de cerveza y
qué beben los de 16 años (p. ej., Ahn y Graham, 1999; Cox y Griggs, 1982).
Pruebe estos problemas con sus amigos. Podría considerar hacer una variación de los
estudios de Gick y Holyoak descritos anteriormente: si sus amigos hacen primero la versión
de cerveza más fácil, ¿es más probable que resuelvan la versión tradicional? Si no, ¿les ayuda
una pista a transferir sus conocimientos? ÿ
CAPÍTULO 12
INDIVIDUAL
DIFERENCIAS
Y
DESARROLLO
ENFOQUES DE LAS DIFERENCIAS INDIVIDUALES
Enfoques metodológicos de las diferencias individuales
diseños
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: UNA DEMOSTRACIÓN
DE ARTEFACTOS DE REGRESIÓN
327
Cuando Balamural Krishna Ambati era estudiante de pregrado en medicina, disfrutaba del ajedrez,
el baloncesto y varios tipos de investigación biológica. ¿Qué lo distinguió de otros estudiantes
universitarios? Bueno, por un lado, tenía 13 años cuando completó su programa de pregrado. Por otro
lado, esperaba convertirse en el graduado más joven de una facultad de medicina. Bala, como se le
llama, es un niño prodigio que dominó el cálculo a los 4 años.
Su promedio de calificaciones y los puntajes de sus exámenes indicaron que debería graduarse de la
escuela de medicina antes de cumplir dieciocho años (Stanley, 1990), y lo hizo a los 17 años en 1995
(Baker, 2006). Cuando comenzó su carrera médica a los 24 años, era demasiado joven para alquilar
un automóvil (Baker, 2006).
Claramente, Bala es diferente de la mayoría de los médicos, quienes podrían comenzar la escuela
de medicina a los 22 años y finalmente terminar a mediados de los 20. ¿Por qué Bala estaba tan por
delante de la típica persona que ingresa a la profesión médica? ¿Cómo y por qué se desarrolló tan
rápido que fue a la escuela con estudiantes mucho mayores que él? Este tipo de preguntas son
abordadas por psicólogos interesados en las diferencias y el desarrollo individuales. En este capítulo,
examinamos algunas cuestiones metodológicas relevantes para llevar a cabo una investigación sobre
cómo se diferencian y se desarrollan las personas.
El estudio de las diferencias individuales comenzó debido a importantes decisiones prácticas que
debían tomarse sobre las personas, pero es un tema que ha sido mayormente ignorado por los
psicólogos experimentales, quienes están interesados principalmente en encontrar leyes generales y
explicaciones para el comportamiento. Los psicólogos que emplean métodos experimentales apenas
están comenzando a investigar las diferencias individuales, aunque durante mucho tiempo ha sido un
tema de preocupación para los psicólogos con intereses más prácticos y aplicados.
escolar. Binet y Simon razonaron que a medida que se desarrollan los niños normales, deberían ser capaces de
manejar problemas más difíciles. Se cree que los niños más pequeños que responden bien a las preguntas
diseñadas para los mayores son inteligentes, y aquellos que no se desempeñan a la altura de su edad se
consideran menos inteligentes que el promedio. Binet y Simon emplearon pruebas de memoria, comprensión,
atención y similares. Definieron operativamente (ver Capítulo 6) la inteligencia como la capacidad de tener éxito en
la escuela, y un predictor de este éxito fue la puntuación del niño en las pruebas que construyeron.
Las pruebas de inteligencia se hicieron muy populares porque cumplen el importante objetivo de determinar
qué niños se beneficiarán de qué tipo de educación. Las correlaciones entre la inteligencia y las medidas de éxito
académico generalmente se encuentran en torno a 0,60. Cuando una prueba predice bien el comportamiento de
un criterio, se dice que tiene validez predictiva (a veces llamada validez de criterio). Además de la validez
predictiva, las pruebas pueden tener una validez aparente considerable, lo que significa que parecen medir algo
que la mayoría de la gente estaría dispuesta a llamar inteligencia. Esto ocurre cuando el éxito en la escuela se
predice mejor mediante elementos de prueba que parecen medir la capacidad mental que mediante pruebas que
miden alguna capacidad que no está relacionada con lo académico, como la destreza.
Los investigadores contemporáneos han tenido más éxito al descomponer la inteligencia en sus
componentes (Gardner, 1983; Hunt & Lansman, 1975; Sternberg, 1988). Sin embargo, todavía
estamos a cierta distancia de poder predecir el rendimiento escolar así como las pruebas de
inteligencia de los empiristas. Los enfoques analítico y teórico se ven mejor como complementarios
que antagónicos, que es la forma en que Jean Piaget, el eminente psicólogo del desarrollo, intentó
comprender el desarrollo intelectual.
Piaget (1932) pasó muchos años observando niños (principalmente los suyos). A partir de las
regularidades empíricas que observó en el desarrollo cognitivo y social, Piaget desarrolló una teoría
integral del desarrollo (Piaget e Inhelder, 1969). La teoría, a su vez, se convirtió en la fuerza rectora
detrás de una parte sustancial de la investigación en psicología del desarrollo. Como señalamos en el
Capítulo 1, los científicos individuales pueden enfocarse en un enfoque particular hacia la comprensión;
sin embargo, una combinación de trabajo empírico y analítico conducirá mejor al progreso científico.
Un segundo conjunto de cuestiones que subyacen al estudio de las diferencias individuales se refiere
a las variables básicas que conducen a ellas. Al igual que en el estudio de la percepción (véase el
Capítulo 7), algunos investigadores han defendido una base nativista (naturaleza) para las diferencias
individuales, mientras que otros han propuesto una base empírica (crianza). Este contraste naturaleza-
crianza es antiguo en psicología (Schultz & Schultz, 1987), y todavía está vivo con mucha controversia.
Según la teoría de la naturaleza, las diferencias genéticas subyacen a las diferencias
individuales. Un estudio reciente de Herrnstein y Murray (1994), The Bell Curve, ilustra una teoría de
la heredabilidad de la inteligencia. En particular, Herrnstein y Murray argumentan que existe un “factor
genético en las diferencias étnicas cognitivas” (p. 270), que explica las diferencias de inteligencia
entre negros y blancos, así como otras diferencias de grupos étnicos. Varios científicos (Fraser, 1995;
Sternberg, 1995) han socavado enérgicamente su propuesta y algunas de sus implicaciones, y Nisbett
(1995) señaló que mucha evidencia se opone a la opinión de Herrnstein y Murray de que las
diferencias entre blancos y negros en las puntuaciones de las pruebas de inteligencia tienen una base
genética.
Una visión nutritiva de las diferencias individuales se centra en los factores experienciales que
infl uyen en cómo se desarrollan los organismos. Ericsson, Krampe y Tesch-Romer (1993) desarrollaron
un ejemplo de este tipo de propuesta para explicar las diferencias en las habilidades de violinistas y
pianistas. Contrariamente a la opinión generalizada de Galton (1869/1979) de que el genio es
hereditario, Ericsson y asociados presentan una variedad de pruebas para demostrar que la calidad
de la maestría musical es una función de la cantidad y
Consideramos aquí sólo un tipo de diferencia individual, la en comparación con el desempeño normativo, como con las
inteligencia, pero los principios generales también son válidos pruebas empíricas. Una puntuación combinada calculada a partir
para otras diferencias individuales. de todos los resultados de las tareas separadas posiblemente se
pueda usar como predictor del rendimiento escolar.
Variables dependientes
Variables independientes
Las variables dependientes en el estudio de la inteligencia son
las medidas de inteligencia utilizadas por cada experimentador. Todas las diferencias individuales, incluida la inteligencia, son
Dado que las nociones de lo que realmente es la inteligencia variables sujetas y no verdaderas variables independientes. Los
difieren mucho entre los experimentadores, es difícil idear una estudios de la inteligencia humana a menudo tienen como objetivo
única medida que sea aceptable para todos. Los enfoques determinar la importancia relativa de los factores genéticos, en
empíricos generalmente se basan en la observación de que a oposición a los ambientales, en la producción de inteligencia.
medida que los niños crecen, pueden realizar tareas más Una de las técnicas empleadas en esta investigación ha sido
complicadas y difíciles. Para individuos de cualquier edad dada, examinar gemelos monocigóticos (idénticos), gemelos dicigóticos
se puede determinar un nivel promedio de desempeño en ciertas (fraternos), otros hermanos y niños no emparentados que se
tareas probando una muestra grande y representativa. Las tareas crían en el mismo hogar o en hogares diferentes. La similitud
particulares o elementos de prueba se seleccionarán sobre la genética varía en estos estudios de la siguiente manera: los
base de sus correlaciones con criterios objetivos de éxito en la gemelos idénticos (por supuesto) tienen la misma herencia
escuela, como las calificaciones y el nivel de lectura, y genética, los gemelos fraternos y otros hermanos son
posiblemente también con criterios subjetivos, como las genéticamente similares en menor grado que los gemelos
calificaciones de los maestros. idénticos, y los niños no emparentados tienen el menor grado de
similitud genética. . La similitud ambiental varía en que los niños
criados en el mismo hogar tienen más experiencias similares que
En cualquier nivel de edad en particular, habrá un número los niños criados en hogares separados.
promedio de elementos que los niños
puede pasar.
Si un niño de 7 años puede aprobar la misma cantidad de
ítems que el niño promedio de 9 años, diríamos que este niño Se pueden plantear varias objeciones a la definición de
tiene una edad mental de 9. El cociente de inteligencia, o CI, se similitud ambiental. En primer lugar, no parece razonable suponer
define como mental. edad dividida por la edad cronológica 100, que todos los pares de niños en el mismo hogar han tenido
o (en este caso) 9/7 100 129. Por defi - experiencias igualmente similares. Los gemelos, y en particular
los gemelos idénticos, a menudo reciben un trato más parecido
nición, un puntaje de 100 significa que un individuo obtuvo el que otros pares de niños, aunque solo sea porque tienen la
promedio para su edad, y cada variación de 15 puntos de este misma edad cuando ocurren varios eventos familiares. Además,
promedio representa una desviación estándar (consulte el los niños adoptivos y los niños biológicos pueden recibir un trato
Apéndice B) de este promedio. Las variantes del CI se utilizan algo diferente incluso cuando tienen la misma edad. Una segunda
como índice de inteligencia. objeción se basa en el hecho de que los hijos adoptivos ingresan
a la familia a edades más tardías que los hijos biológicos, aunque
Una prueba de inteligencia puramente analítica (ninguna sea por unas pocas semanas o meses. Aunque esta diferencia
es actualmente de uso general) contendría muchas subpruebas puede parecer trivial cuando la inteligencia se mide entre los 10
diseñadas para medir propiedades específicas del sistema de y los 15 años o más, muchos estudios han demostrado que las
procesamiento de información de una persona. experiencias tempranas son bastante importantes en el desarrollo
Ejemplos de estas propiedades pueden ser la capacidad de la de la inteligencia.
memoria a corto plazo y la velocidad de exploración, la
organización de la memoria a largo plazo y el tiempo de acceso,
las velocidades máximas de transmisión de información en varios
tipos de tareas y la capacidad de asignar atención. El desempeño Una tercera objeción se basa en la influencia potencial de
en estas tareas podría ser experiencias que ocurren incluso antes
que las de las primeras semanas en el hogar, es decir, preguntas, en lugar de tener que “razonar” las respuestas,
las que ocurren en el ambiente prenatal. Al igual que parecerán más inteligentes que otros individuos que no
con la herencia genética, estas experiencias prenatales han aprendido previamente estos hechos, palabras o
generalmente serán más similares para los gemelos, relaciones en particular.
menos similares para los hermanos y menos similares Aunque se han eliminado muchos ítems de las
para los niños no emparentados. La similitud de la pruebas de inteligencia modernas para hacerlas más
experiencia prenatal y posnatal temprana puede, por lo "justas para la cultura" o menos influenciadas por
tanto, estar correlacionada con la similitud genética, lo experiencias de aprendizaje particulares, es imposible
que hace que sea arriesgado interpretar las correlaciones eliminar todos los efectos del aprendizaje, el uso del
de una u otra con la inteligencia medida. lenguaje, la motivación, el conocimiento cultural. ,
experiencia en pruebas y otros factores que se sabe que
Variables de control afectan las medidas de inteligencia. Esto no es un
problema si la inteligencia se interpreta simplemente
En estudios de inteligencia, es difícil definir un conjunto como probabilidad de éxito en la escuela, ya que estos
exhaustivo de variables de control. Sin embargo, otros factores sin duda infl uyen en el rendimiento
generalmente se piensa que el factor individual más escolar. Pero si la inteligencia se interpreta como
importante a controlar es el aprendizaje específico que "capacidad mental" o alguna construcción similar, los
podría afectar el desempeño de la prueba. Si ciertas efectos de estas variables extrañas deben minimizarse.
personas han aprendido las respuestas a un número de la prueba
Varias medidas de la misma cantidad, en general, no coincidirán exactamente. Esta variabilidad puede ser
el resultado de un error o de un cambio real en la cantidad medida. No podemos decir, sin algunos supuestos
adicionales, cuánto error hay en nuestra medida. Entonces, ¿cómo podemos preguntar si la inteligencia cambia?
Una suposición útil, que permite romper el círculo lógico, sostiene que la cantidad medida es estable durante
períodos relativamente cortos. (Si un investigador mide su inteligencia por la mañana y luego nuevamente por la
tarde, se puede suponer que cualquier cambio es causado por un error de medición en lugar de un cambio real
en la inteligencia). Con esta suposición, un psicólogo puede estimar el error de medición e intentar mejorar y
especificar la fiabilidad del instrumento de medida. Las preguntas relacionadas con la estabilidad de la cantidad
subyacente, en este caso la inteligencia, pueden responderse. Primero revisamos algunas de las técnicas que
usan los desarrolladores de pruebas para evaluar la confiabilidad de sus medidas, y luego revisamos un estudio
que intentó determinar la estabilidad de la inteligencia durante muchos años.
Confiabilidad de la prueba
Señalamos anteriormente que el concepto de inteligencia no está bien definido teóricamente. Algunos teóricos
postulan un número de habilidades mentales separadas, quizás más de 100 (Guilford, 1967). Otros creen que
hay una habilidad mental primaria y que aunque otras habilidades más específicas pueden estar aisladas, son
menos importantes (Herrnstein & Murray, 1994). Esta habilidad primaria ha sido descrita como “una capacidad
para el razonamiento abstracto y la resolución de problemas” (Jensen, 1969, p. 19). Para probar esta habilidad,
reunimos colecciones de problemas o tareas y se las presentamos a individuos para que las resuelvan,
generalmente dentro de un período específico. El puntaje que logra un individuo se compara luego con los
puntajes obtenidos por otros. Sin embargo, antes de depositar mucha confianza en el puntaje de un individuo,
necesitamos saber qué tan confiable es. ¿Lograría el individuo aproximadamente el mismo puntaje si lo
evaluáramos nuevamente al día siguiente o una semana después? Debido a que creemos que la habilidad
subyacente no cambia apreciablemente durante un tiempo tan corto, atribuimos un gran cambio en las
puntuaciones al error de medición, lo que indica falta de confiabilidad en nuestra prueba. Este procedimiento de
dar la misma prueba dos veces seguidas durante un intervalo de tiempo corto se usa para determinar lo que se
llama la confiabilidad de prueba-reprueba de una medida. Generalmente se expresa como una correlación
Se puede emplear un procedimiento ligeramente diferente para evitar problemas tales como los efectos de
la práctica específica. Esta técnica consiste en dar formas alternas o paralelas de la prueba en las dos ocasiones
de prueba. De nuevo, si las correlaciones entre la primera y la segunda puntuación son altas, indican la fiabilidad
de las pruebas. Además, de esta manera se puede determinar la equivalencia de las dos formas de la prueba.
Se puede utilizar un tercer procedimiento para evaluar la confiabilidad con una sola presentación de prueba.
Esta técnica proporciona confiabilidad dividida por la mitad; implica dividir los elementos de la prueba en dos
grupos arbitrarios (como elementos pares e impares) y correlacionar las puntuaciones obtenidas en las dos
mitades de la prueba. Si estas correlaciones son altas, se confirma la confiabilidad de la prueba. Además, se
establece la equivalencia de los ítems de prueba.
Correlaciones entre los puntajes de las pruebas de coeficiente intelectual en cuatro administraciones de 1931 a 1969.
WAIS WAIS
SB SB SB
Prueba (Formulario L) (Formulario L) Completo Verbal Actuación (Formulario LM) Completo Verbal Actuación
1931 SB
(Formularios L y M) .sesenta y cinco .59 .64 .60 .54 .41 .39 .28 .29
1941 SB
(Formulario L) .85 .80 .81 .51 .68 .53 .57 .18
1956 SB
(Formulario L) .83 .89 .46 .77 .58 .68 .14
1956 WAIS
Completo .87 .84 .72 .73 .69 .41
Verbal .59 .73 .63 .70 .20
Actuación .36 .67 .47 .57
1969 SB
(Formulario LM) .77 .86 .36
1969 WAIS
Completo .87 .74
Verbal .38
Nota: SB es la prueba de Stanford-Binet, aplicada a todas las edades, y WAIS es la escala de inteligencia para adultos de Wechsler, aplicada en 1956 y 1969. Todas las correlaciones son significativas más
allá del nivel .01. De “Intelligence at Middle Age: A Thirty-Eight Year Follow-Up”, de J. Kangas y K. Bradway, 1971, Developmental Psychology, 5, págs. 333–337, Tabla 2. La parte de la tabla correspondiente
a 1931–1956 es una reimpresión de un artículo de Katherine P. Bradway y Clare C. Thompson, 1962, Journal of Educational Psychology. Copyright 1962 por la Asociación Americana de Psicología.
Reimpreso con permiso. *Debido a los datos incompletos de dos de los sujetos, el número total de sujetos en los que se basa cualquier correlación varía de 109 a 111.
se registraron ganancias continuas para todos los grupos, incluidos los grupos medianos, que no se
muestran. Pero un grupo parecía ganar mucho menos que los demás: el grupo de mujeres con puntaje
alto. Este resultado puede o no ser causado por un efecto techo (ver Capítulos 10 y 11), porque los
hombres con puntajes altos muestran un aumento sustancial. Dado que no sabemos si los hombres y las
mujeres con puntajes altos eran equivalentes inicialmente, y dado que las mujeres con puntajes bajos
mejoraron drásticamente, existe la posibilidad de un efecto techo.
Aunque este estudio no puede considerarse concluyente en sí mismo, en general está de acuerdo
con otros al mostrar que la inteligencia medida permanece relativamente estable durante una gran parte
de la vida, desde la primera infancia hasta la mediana edad. Esto también significa que las medidas
tempranas del desarrollo mental pueden predecir la inteligencia posterior, lo que Bornstein y Sigman
(1986) confirmaron en un importante estudio longitudinal.
El diseño experimental más típico en el que varía la edad se denomina diseño transversal. En
este diseño, un investigador toma una muestra representativa de la población y prueba a los sujetos
en el experimento o procedimiento de interés. Si un investigador estuviera interesado en cómo varía
la inteligencia con la edad, él o ella podría evaluar a personas de 5, 10, 15, 20, 25, 30, 35, 40, 45, 50,
55, 60, 65, 70 y 75 años. años. Si se hiciera la prueba a 25 personas de cada edad, entonces se
necesitarían hacer la prueba a 375 personas. De hecho, este es un diseño de investigación bastante
común, aunque la gran cantidad de edades muestreadas es atípica. Este diseño para la investigación
del desarrollo ha fallado por motivos importantes. Se ha argumentado que es probable que muchos
otros factores se confundan con la edad en este tipo de diseño. Por ejemplo, es probable que las
personas que tenían 25 años en 1997 difieran de las personas que tenían 65 o 75 años en varias
dimensiones importantes: los sujetos mayores habrán sido criados y educados de manera diferente,
es más probable que hayan emigrado a los Estados Unidos, es más probable que hayan servido en
las fuerzas armadas, y así sucesivamente. Estos factores de confusión se han denominado efectos
de cohorte, que se refieren a los efectos de los diferentes tipos de personas (las cohortes) que
crecen con personas de diferentes edades.
Tus cohortes, como tus compañeros de clase, son necesariamente diferentes de las cohortes de
tus abuelos. Otra diferencia crucial en muchos estudios sobre rendimiento intelectual es que es
probable que las personas mayores hayan tenido menos años de educación formal que las personas
más jóvenes. Por lo tanto, si al usar un diseño de investigación transversal, los investigadores
descubren diferencias entre personas de diferentes edades, tendrán dificultades para mostrar que la
edad es responsable de la diferencia en lugar de cualquier número de factores de confusión.
Este ejemplo ilustra el problema de los efectos de la historia, la confusión de la fecha del examen con
la edad. Es decir, los eventos sociales (p. ej., la Segunda Guerra Mundial y la Guerra de Vietnam) exclusivos
del momento de la prueba pueden tener un efecto significativo en el comportamiento de interés (p. ej., las
actitudes expresadas acerca de la guerra). Obviamente, un investigador sería precipitado al concluir que las
actitudes de las personas hacia la guerra y la defensa se vuelven menos favorables a medida que envejecen.
Otro problema con el diseño longitudinal implica pruebas repetidas. Los sujetos en estudios longitudinales
son, por definición, medidos múltiples veces. Por lo tanto, el investigador cuidadoso debe tratar de asegurarse
de que el desempeño no refleje la experiencia previa con la prueba. Un problema final con los estudios
longitudinales es la deserción de sujetos. Con el tiempo, las personas pueden abandonar el experimento (por
muerte o mudanza), y esta tasa de abandono aumenta con el tiempo. De hecho, las tasas de deserción
pueden llegar al 50 por ciento en algunos estudios longitudinales (Pedhazur & Pedhazur Schmelkin, 1991).
Desafortunadamente, los sujetos no abandonan los estudios al azar. En otras palabras, puede haber
diferencias importantes entre los sujetos que permanecen en un estudio y los que no. En general, los diseños
longitudinales no conducirán a conclusiones sólidas acerca de cómo la edad altera el comportamiento cuando
los cambios experienciales durante el período entre pruebas pueden haber producido el cambio.
Dados estos problemas de diseños transversales y longitudinales, ¿cómo pueden los psicólogos realizar
una investigación sólida sobre las diferencias de desarrollo? De hecho, muchos de los estudios del desarrollo
de los que dependen los psicólogos han empleado estudios transversales y longitudinales (con predominio de
los primeros).
Sin embargo, Schaie (1977) abogó por otros diseños de investigación que permitieran evaluaciones
menos ambiguas de los cambios en el desempeño con la edad. Uno de estos, el diseño secuencial cruzado,
se ilustra en la Figura 12.2, que muestra cómo las personas nacidas en 4 años consecutivos (1987–1990)
podrían someterse a pruebas en 4 años consecutivos (2006–2009). Cada columna de la figura representa un
diseño transversal, ya que en un año se están evaluando personas de diferentes edades. De manera similar,
cada fila representa un diseño longitudinal, ya que las personas de la misma edad se prueban repetidamente
a medida que envejecen.
1989 17 18 19 20
1990 dieciséis 17 18 19
equipo de tiempo
Diseño
transversal
Diseño
ÿ FIGURA 12.2
Además, la figura 12.2 ilustra un tercer tipo de diseño en diagonal. Este es el diseño de retardo de
tiempo, cuyo objetivo es determinar los efectos del tiempo de prueba mientras se mantiene constante la
edad. La edad en el momento de la prueba se mantiene constante en 19 años en el diseño de intervalo
de tiempo, por lo que cualquier cambio observado puede atribuirse a las eras cambiantes en las que se
evalúa a las personas. Sin embargo, la edad en este diseño se confunde tanto con el año de nacimiento
como con el año de la prueba. En todo el diseño secuencial cruzado, si tanto los componentes
longitudinales como transversales muestran alguna variable dependiente que cambia con la edad y el
componente de retardo de tiempo no muestra cambios con el tiempo de la prueba mientras se mantiene
constante la edad, entonces un investigador puede atribuir con seguridad la variable observada. cambios
a la edad en sí y no algún factor de confusión.
Considere el siguiente juego, que se llama juego de imitación. El juego de imitación es un experimento
hipotético ideado por Turing (1950) en un artículo titulado “Computing Machinery and Intelligence”. El
propósito de Turing era idear una situación que permitiera evaluar si una máquina podía pensar.
Se juega con tres personas, un hombre (A), una mujer (B) y un interrogador (C) que pueden ser de
ambos sexos. El interrogador permanece en una habitación aparte de los otros dos.
El objeto del juego para el interrogador es determinar cuál de los otros dos es el hombre y cuál es la
mujer. Él (el interrogador) los conoce por las etiquetas X e Y, y al final del juego dice "X es A e Y es B" o
"X es B e Y es A".
El interrogador puede hacer preguntas a A y B de la siguiente manera: C: “¿Podría X decirme el largo de
su cabello?” Ahora suponga que X es en realidad A; entonces A debe responder. El objetivo de A en el
juego es tratar de hacer que C haga una identificación incorrecta. Por lo tanto, su respuesta podría ser:
"Mi cabello está cubierto de tejas y los mechones más largos miden aproximadamente nueve pulgadas".
Definiciones operacionales
Muchos consideran válida la prueba de Turing porque tiene dos características importantes. El primero
es el hecho de que la evaluación de la inteligencia de las máquinas usando el juego de imitación implica
un experimento: si un interrogador cree que una máquina es equivalente a una persona. La segunda
característica es más importante para nuestros propósitos. El experimento descrito por Turing produce
una definición operativa.
Las definiciones operativas se discutieron en el Capítulo 6, utilizando el concepto de umbral como
ejemplo. Recuerde que una definición operativa es una fórmula para construir una construcción, como
la inteligencia, de manera que otros científicos puedan duplicarla, especificando las operaciones
utilizadas para producirla y medirla. Una definición operativa del hambre podría especificar retener la
comida de un perro por un tiempo y luego medir cuánto come el perro.
Asimismo, según la definición operativa de inteligencia de Turing, especificamos la producción de
inteligencia, un programa de máquina que responde preguntas, y medimos la inteligencia por la cantidad
de engaño que producen las respuestas. Esta parece ser una definición operativa perfectamente
aceptable, entonces, ¿por qué ha generado tanto debate?
Las definiciones operativas casi siempre tienen una aplicabilidad limitada, lo que significa
que su validez se verá afectada. Reconsidere la definición operativa de hambre que se presentó
anteriormente: retenga la comida por un tiempo y observe la cantidad ingerida.
¿Especifica esto adecuadamente lo que entendemos por hambre? Probablemente no. Los seres
humanos comen por una variedad de razones, solo una de las cuales tiene que ver con la
privación de alimentos. A veces comemos para ser sociables, a veces comemos porque
deseamos un tipo particular de comida, ya veces comemos porque no hemos comido durante
varias horas. Además, la definición operativa anterior no es simétrica, porque no comer no
significa que el estómago esté lleno. A veces no comemos porque tenemos malestar estomacal,
a veces no comemos porque estamos tratando de perder peso ya veces no comemos porque
acabamos de comer. Para caracterizar el concepto de hambre de una manera que dé cuenta de
este tipo de observaciones, necesitamos tener múltiples definiciones operativas que encajen en
una teoría coherente. Tenemos que usar operaciones convergentes (ver Capítulos 7 y 14).
Gran parte de la crítica contra la IA fuerte es del tipo que podría formularse contra nuestra
definición de hambre. “Las máquinas no son humanas. Pero, ¿puede hablar una computadora?
¿Puede escribir sonetos? Turing anticipó algunas de estas críticas y cree que se pueden
responder a tiempo; sí, un programa de computadora puede hacer esas cosas de tal manera
que un observador (interrogador) no sabría que una máquina las produjo. Como dijo Turing
(1950),
Algunas de las críticas y la refutación de Turing pueden ser preguntas empíricas que
podrían resolverse mediante la observación y la experimentación, pero incluso si se desarrollaran
máquinas que pudieran hacer estas cosas, hay críticas adicionales. Abordaremos ahora una
crítica a la validez del test de Turing.
Es posible que haya notado que no definimos la inteligencia cuando analizamos la confiabilidad
en la primera sección de este capítulo. Lo omitimos porque los desarrolladores de pruebas suelen tener
un problema pragmático a mano. Binet simplemente quería determinar el nivel de grado apropiado para
los estudiantes de las escuelas francesas. En estas circunstancias pragmáticas, la validez de la prueba
está determinada por algún criterio, como el éxito en la escuela. De hecho, las pruebas Stanford-Binet
y Wechsler hacen un buen trabajo al predecir el rendimiento académico. Por lo tanto, podría sentirse
tentado a decir que la inteligencia es lo que miden las pruebas si tienen una buena validez de criterio
(las pruebas predicen el rendimiento académico). El problema aquí es doble. Por un lado, la mayoría
de las pruebas de inteligencia se centran en las habilidades matemáticas y verbales, lo que significa
que ignoran otro tipo de actividades intelectuales importantes, como la habilidad musical y la capacidad
de comprender a otras personas. Por otro lado, la capacidad intelectual en un sentido académico a
menudo se considera una forma limitada y culturalmente sesgada de definir la inteligencia. La típica
prueba de CI no mide la capacidad de una persona para triunfar en la vida o adaptarse al entorno.
Entonces, según el argumento, los puntajes de CI de las personas pueden no tener nada que ver con
el sentido común o con llevar una vida productiva. Además, incluso si las personas fueran productivas
y tuvieran sentido común, sus puntajes de coeficiente intelectual no predecirían su éxito en otro
contexto, como sobrevivir en una isla desierta o vivir bien en la jungla. Además, las pruebas de
coeficiente intelectual son, según algunos críticos, un reflejo de los valores de la clase media alta blanca
y no reflejan lo que significa la inteligencia para la sociedad en su conjunto. El hallazgo de que los
estereotipos culturales afectan el desempeño en otras pruebas respalda este supuesto sesgo (Steele y
Aronson, 1995). Por ejemplo, a las mujeres les va peor en un examen difícil de matemáticas después
de haber sido expuestas al estereotipo de que “las mujeres no pueden hacer matemáticas” (Spencer, Ste
Por lo tanto, aceptar la definición de inteligencia como lo que miden las pruebas de inteligencia no
resuelve muchos problemas. Está limitado en su rango de experiencia, y es probable que la definición
sea cuestionada por la concepción del público en general de lo que es la inteligencia (Sternberg, 1995).
Un tema relacionado con el estudio de la inteligencia y las diferencias individuales gira en torno a
los intentos de psicólogos y educadores por mejorar el desempeño de los individuos y la importancia
de evaluar dichos intentos. Como puede sospechar, la medición precisa se encuentra en el centro
de la evaluación del cambio. Siempre que se produce un error de medición, existe la posibilidad de
que concluyamos erróneamente que se ha producido o no se ha producido algún tipo de cambio.
Aunque esta declaración puede parecerle poco profunda, varios estudios psicológicos han sido
criticados por no tener en cuenta adecuadamente su verdad.
Cuando existen diferencias de población, existe la posibilidad de ser engañado por lo que se conoce
como artefactos de regresión, o efectos experimentales producidos por “regresión estadística”, en
lugar de manipulaciones experimentales. Discutimos los artefactos de regresión en el Capítulo 2.
Quizás un ejemplo ayude aquí. Suponga que usted es un estudiante A y que su vecino es un
estudiante C, aunque ambos tienen antecedentes similares. En una tarea en particular, ambos
reciben una B. En un esfuerzo por mejorar, su vecino decide asistir a una serie de sesiones de
ayuda. Su instructor decide evaluar la efectividad de las sesiones de ayuda comparando las
calificaciones futuras de los estudiantes de la sesión de ayuda con las calificaciones futuras de los
estudiantes que no son de la sesión de ayuda que tienen antecedentes similares y recibieron las
mismas calificaciones en la tarea anterior. Usted es seleccionado como el estudiante emparejado
para ser comparado con su amigo.
En la próxima tarea, usted recibe una A- y su amigo recibe una C.
El curso de los acontecimientos en este programa de evaluación se ilustra en la Tabla 12.2. Tenga
en cuenta los cambios en la calificación del criterio en función de la calificación media de la persona.
¿Debería el instructor concluir que las sesiones de ayuda son dañinas porque su amigo pasó de a
, mientras
retrocedieron hacia sus
que
calificaciones
usted pasó medias.
de B a A-?
El efecto
Probablemente
visto en este
no, ya
pequeño
que ambos
estudio
simplemente
probablemente
no sea un verdadero efecto de tratamiento sino más bien un artefacto de regresión causado por el
hecho de que usted y su amigo no eran realmente estudiantes equivalentes. La sesión de ayuda
puede incluso tener
ÿ TABLA 12.2
Tú A B No A
Vecino C B Sí C
Luego se calcularon y compararon las medidas del rendimiento académico y el potencial de los niños
experimentales (Head Start) y de control (sin Head Start). La conclusión general de este gran estudio fue
que Head Start no fue eficaz para eliminar los efectos de la pobreza y la desventaja social.
Otros psicólogos (Campbell y Erlebacher, 1970a) se apresuraron a criticar este estudio por varios
motivos. Primero, señalaron que los resultados del estudio sin duda fueron causados parcialmente por
artefactos de regresión. Peor aún, no se pudo estimar la magnitud de los artefactos, lo que arrojó dudas
sobre todo el conjunto de hallazgos.
El problema básico es el de hacer coincidir (ver el Capítulo 2 para un ejemplo similar).
Cicirelli y sus compañeros de trabajo intentaron encomiablemente unir una muestra de niños
desfavorecidos que habían estado en el programa Head Start con otros de la misma área que no habían
estado en el programa. Las diferencias posteriores entre los dos grupos deberían haberse debido al
programa, ¿no? No necesariamente. Es correcto solo si las dos muestras provienen de las mismas
distribuciones de población subyacentes, lo cual es poco probable. Lo que es probable es que las dos
poblaciones difieran, con los niños de "tratamiento" desfavorecidos provenientes de una población que
era más pobre en capacidad que los niños de "control". Los niños de “tratamiento” que asistieron a Head
Start generalmente fueron preseleccionados para ser de un entorno desfavorecido (razón por la cual
fueron incluidos en el programa), mientras que los “controles” que no estaban en el programa pueden
haber venido de una población diferente que era mayor en habilidad. El problema básico es que los
sujetos no fueron asignados aleatoriamente a
45
rendimiento
percepción/
Puntuación
de
Educativamente
sin tratar
40
35
Óptimo no óptimo
Puntuación en la prueba de detección al nacer
ÿ FIGURA 12.3
Los resultados de Breitmayer y Ramey (1986), que muestran una interacción del tratamiento educativo
y la salud al nacer en la puntuación de percepción/desempeño obtenida a los cincuenta y cuatro meses
de edad. Se observaron interacciones similares, aunque no tan pronunciadas, en las puntuaciones de
las partes verbal y cuantitativa de las pruebas de inteligencia.
Muchos de ustedes pueden tener fobia a las matemáticas; otros de ustedes pueden odiar los exámenes de
opción múltiple. Si pertenece a cualquiera de esos grupos, o si tiene gustos o disgustos intelectuales
particulares que pueden influir en su desempeño en los exámenes, entonces está mostrando los efectos de
la motivación y la emoción en el desempeño intelectual.
Tales gustos y disgustos deberían ser particularmente importantes para que los maestros de escuela primaria
identifiquen, porque una vez que a un estudiante comienza a disgustarle algo, podría surgir un efecto de bola
de nieve. Por ejemplo, supongamos que a un estudiante joven le comienzan a disgustar las matemáticas por
alguna razón. Ese estudiante no solo encontrará aversivos los exámenes de matemáticas, sino que también
encontrará aversivo el aprendizaje de las matemáticas. No aprender conceptos matemáticos más nuevos
conducirá a un desempeño deficiente en las pruebas, lo que aumentará la aversión, y así sucesivamente.
Los puntos de vista emocionales hacia las búsquedas cognitivas no necesitan ser específicos. Dweck y
sus asociados han identificado dos metas generales que los niños parecen tener cuando emprenden
actividades intelectuales, y estas metas se manifiestan en las teorías primitivas que los niños tienen sobre la
inteligencia (Dweck, 1999; Dweck & Bempechat, 1983; Dweck & Elliott, 1983). ; Levy, Plaks, Hong, Chiu y
Dweck, 2001). Algunos niños adoptan lo que se llama metas de desempeño.
Estos niños parecen estar motivados por no parecer tontos; quieren verse inteligentes y no recibir evaluaciones
negativas de sus compañeros o sus maestros.
Los niños que adoptan metas de desempeño tienen lo que Dweck llama una entidad, la teoría de la
inteligencia. Estos niños creen que la inteligencia fija que tienen se evalúa mejor por qué tan bien los evalúan
los demás y qué tan bien lo hacen.
Lo primero que se debe hacer en esta investigación es seleccionar sujetos en los dos
grupos. Desafortunadamente, no hay pruebas publicadas que sirvan para este propósito.
Sin embargo, Dweck ha proporcionado una forma bastante sencilla de distinguir entre los
teóricos de la entidad y los incrementales instrumentales. Se les pide a los niños que elijan una
de dos afirmaciones sobre la inteligencia, donde una afirmación refleja metas de desempeño y
la otra refleja metas de aprendizaje. Por lo tanto, tendría que inventar una serie de tales pares
de declaraciones (digamos, 16). El puntaje de un niño en esta prueba sería el número de veces
que se seleccionó un tipo particular de declaración. La puntuación de una entidad podría oscilar
entre 0 y 16 en este ejemplo. Algunos ejemplos de los tipos de sentencias que puede generar
son:
1. (a) Puedes aprender cosas nuevas, pero lo inteligente que eres se mantiene bastante
lo mismo.
(b) La inteligencia es algo que puedes aumentar tanto como quieras.
La manera más fácil de determinar a qué grupo pertenece un niño es calcular la puntuación de entidad mediana
(es decir, la del medio) para todos los niños que tomaron la prueba. Luego, asigna a los niños al grupo de
entidades que puntuaron alrededor de la mediana del grupo, y asigna al resto de los niños, aquellos que
puntuaron por debajo de la mediana, al grupo incremental instrumental. Diseñar una prueba confiable y válida
podría ser extremadamente difícil y llevar mucho tiempo. También es posible que le resulte difícil obtener una
amplia variedad de puntajes en su examen. Para asegurarse de obtener muchos niños con puntajes muy altos
y muchos con puntajes muy bajos, es posible que deba revisar el conjunto de preguntas de la prueba hasta
que encuentre un conjunto que produzca una buena distribución de puntajes.
Estas tareas diferían en su dificultad y en los objetivos de desempeño (aprender o parecer inteligente). Después
de hacer sus elecciones, a todos los niños se les dio la misma tarea, que era de dificultad moderada. Por lo
tanto, manipularon la percepción de los niños sobre la tarea mediante instrucciones previas. El mismo tipo de
procedimiento podría realizarse en el presente experimento. Podría usar instrucciones similares a las que usó
Dweck y luego hacer que los niños realicen alguna tarea. Para evaluar a la mayoría de los niños, a menudo es
útil sugerirles que el procedimiento de prueba es una especie de juego. Esto se hace para mantener su
motivación e interés. Para la tarea orientada al aprendizaje, se les puede decir a los niños lo siguiente: “En este
juego probablemente aprenderás algunas cosas nuevas, pero también cometerás algunos errores. Puede que
te confundas y te sientas tonto, pero deberías aprender algunas cosas interesantes”. Para la tarea orientada al
rendimiento, las instrucciones podrían ser: “Este juego es muy divertido porque es más fácil que otros. Aunque
no aprenderá mucho, realmente me mostrará cuánto pueden hacer los niños”. A continuación, necesitará dos
tareas, una para cada conjunto de instrucciones. Para mantener el interés de los niños, las dos tareas no deben
ser demasiado similares. Pero con dos tareas diferentes tendrás que equilibrar las tareas a través de
instrucciones para los dos grupos de niños. Seleccionar tareas puede ser difícil, pero la forma más directa de
encontrarlas sería obtener la ayuda de un maestro de niños que tengan la misma edad que los sujetos de
prueba. El maestro debería poder ayudarlo a seleccionar dos tareas intelectuales que el típico estudiante de
tercer grado, por ejemplo, encontraría de dificultad moderada.
culto Llamemos a las dos tareas que seleccione A y B. En la tabla 12.3 se ilustran un contrapeso adecuado y
una descripción general del diseño.
Se predice que los sujetos del grupo entidad tendrán peor desempeño en la tarea precedida por el
aprendizaje de instrucciones que en la tarea precedida por la ejecución.
instrucciones. Por otro lado, esperamos que los sujetos incrementales instrumentales lo
hagan mejor en la tarea precedida por las instrucciones de aprendizaje y peor en la tarea
precedida por las instrucciones de ejecución.
Este proyecto de investigación parece ser manejable, con la posible excepción de
desarrollar la prueba de teoría de entidades. Sin embargo, la investigación sobre variables
temáticas, especialmente con niños, presenta muchas dificultades para el investigador. Un
problema tiene que ver con la ética. Dado que es poco probable que un niño pueda dar un
verdadero consentimiento informado para participar en un experimento, se debe permitir
que los padres de los niños indiquen si quieren que su hijo participe. Esto significa que
tendría que acercarse a un maestro de escuela primaria, obtener su consentimiento para
evaluar a los estudiantes y luego hacer que los padres firmen un formulario de consentimien
Su profesor podrá ayudarlo a diseñar un formulario de consentimiento que sea aceptable
para estos fines.
Otro tema que hay que resolver es la edad de los niños. La mayoría de los trabajos
anteriores han utilizado niños en los grados de escuela primaria y secundaria, y eso sería
una apuesta segura aquí. Si los niños son demasiado pequeños, por ejemplo, en edad
preescolar, es posible que no tengan una idea bien desarrollada de lo que significa ser intelig
Por otro lado, los estudiantes de secundaria pueden ser demasiado sofisticados en sus
creencias sobre la inteligencia para permitirle generar diferentes grupos de sujetos.
Sin embargo, Dweck, Mangels y Good (2004) informan sobre experimentos que mejoraron
con éxito la motivación intelectual en estudiantes universitarios.
Otro tema más tiene que ver con el género. ¿Quiere evaluar solo a niños, solo a niñas
o una mezcla? Dweck y colegas (2004) informan que los niños y las niñas responden de
manera diferente a las situaciones de aprendizaje y desempeño, por lo que al menos le
gustaría asegurarse de tener la misma proporción de cada sexo en cada uno de sus
grupos de prueba, como el 45 por ciento. chicos de cada grupo. Por otro lado, si está
interesado en las formas en que los niños y las niñas pueden
ÿ RESUMEN
1. El enfoque empírico de las diferencias individuales se basa diseños transversales y longitudinales dentro de él y
en encontrar correlatos de la diferencia en cuestión, como permite la evaluación de la variación causada por el
las pruebas de inteligencia diseñadas para predecir los cambio de épocas o épocas (en lugar de la edad) a través
puntajes escolares. Las teorías analíticas de las diferencias del examen del diseño de desfase temporal incorporado.
individuales intentan proporcionar explicaciones señalando En el diseño de lapso de tiempo, las personas de la misma
las diferencias en los procesos psicológicos subyacentes. edad se examinan en diferentes eras, lo que revela el
Las teorías de la naturaleza sobre las diferencias efecto de la era en lugar de la edad. El diseño secuencial
individuales sostienen que la genética subyace en ellas, cruzado permite hacer inferencias más fuertes sobre los
mientras que la visión de la crianza se centra en los efectos de la edad, sin confundirlos con otros factores,
factores experienciales que influyen en el desarrollo de un pero desafortunadamente tales diseños son difíciles de
organismo. Una visión más completa, de Hebb, propone implementar en la práctica. La mayor parte de la
dar cuenta de las diferencias individuales considerando investigación sobre el desarrollo todavía se basa en el
seis factores que interactúan. enfoque transversal, con intentos de emparejar a las
2. La confiabilidad de los instrumentos y dispositivos de personas en otros factores, como el estatus socioeconómico.
medición es crucial para toda investigación científi ca, 4. Las definiciones operativas de los constructos psicológicos
incluido el estudio de las diferencias individuales. Es difícil implican especificar el constructo en términos de las
idear medidas fiables de habilidades mentales complicadas operaciones experimentales utilizadas para estudiarlo. La
como la inteligencia, pero si se derivan medidas fiables, prueba de Turing define la inteligencia de tal manera que
se pueden utilizar para investigar cuestiones tan las máquinas podrían poseer inteligencia. La controversia
interesantes como la estabilidad de la cantidad, medida suscitada por esta prueba apunta al problema de la validez
durante largos períodos. de las definiciones operativas.
3. El diseño más común utilizado en la investigación del 5. Cuando las diferencias individuales, como la inteligencia,
desarrollo es el diseño transversal, en el que se evalúa a el peso o la edad, se examinan en experimentos, se
personas de diferentes edades (una sección transversal denominan variables de sujeto. Por su naturaleza, las
de la población). Desafortunadamente, cualquier diferencia variables de sujeto impiden la asignación aleatoria de
encontrada puede deberse a factores que se confunden sujetos a condiciones; uno debe evitar concluir que los
con la edad, como las diferencias en la educación u otras efectos experimentales son producidos por las variables
experiencias de vida particulares. En el diseño longitudinal, del sujeto, porque algún factor de confusión puede haber
el mismo grupo de personas se prueba repetidamente a producido el efecto.
medida que envejecen, eliminando así gran parte de la 6. En los estudios en los que los sujetos de dos grupos (un
confusión que ocurre en el enfoque transversal. tratamiento y un control) se emparejan según algún
Desafortunadamente, en algunos casos el diseño criterio en lugar de ser asignados al azar a los dos grupos,
longitudinal también puede ser engañoso, cuando los existe una gran probabilidad de que la regresión estadística
cambios observados no se deben a la edad per se, sino a afecte los resultados y las conclusiones. dibujado. Cuando
experiencias de vida que simplemente están se seleccionan grupos extremos de sujetos (extremo en
unamúltiples
correlacionadas con la edad. El diseño secuencial cruzado incorpora dimensión), sus puntajes
ÿ TÉRMINOS CLAVE
ÿ PREGUNTAS DE DISCUSIÓN
1. A menudo, las pruebas psicológicas se construyen para medir 3. Discuta las ventajas y desventajas de cada uno de los siguientes
algún constructo psicológico, como la inteligencia, la depresión diseños de investigación para la investigación del desarrollo:
o la restricción dietética. Un requisito primordial es que dichas
pruebas sean fiables. ¿Qué es la confiabilidad? Discuta tres una. transversal
CONEXIONES WEB
Puede encontrar la página de inicio del Dr. Bala Ambati en:
http://www.mcg.edu/eyes/Ambati_Page.html
Los siguientes sitios tienen documentos que puede descargar sobre el trabajo de Howard Gardner sobre
las inteligencias múltiples:
http://pzweb.harvard.edu/PIs/HG.htm
http://www.howardgardner.com/Papers/papers.html
El siguiente sitio detalla la historia de las pruebas y teorías de inteligencia, y tiene enlaces a las
descripciones de los principales investigadores:
http://www.indiana.edu/intell/
PSICOLOGÍA EN ACCIÓN
CAPÍTULO 13
SOCIAL
PSICOLOGÍA
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
RECURSOS DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: EL PODER DE ESTAR EN UNA
EXPERIMENTO
El comportamiento de cada ser humano está potencialmente determinado por una red de infl uencias
sociales y culturales complejas. Muchos de los actos que realizamos todos los días están determinados
por la cultura y la sociedad en la que nacemos y crecimos. Nuestra experiencia está limitada por nuestra
cultura, por lo que estamos expuestos solo a un conjunto muy pequeño de acciones potenciales que los
humanos podrían realizar. La mayoría de la gente en nuestra sociedad nunca hablará hotentote, ni
navegará en canoas ni cazará ñus, por la muy buena razón de que estas actividades no son parte de
nuestra cultura. En cada sociedad, el comportamiento del individuo se ajusta en gran medida al de sus
“personas importantes”, es decir, familia, compañeros, maestros, etc.
El estudio psicológico de cómo la sociedad afecta al individuo es parte del campo de la psicología
social. Este es un campo amplio: una enorme variedad de temas de investigación se encuentran bajo la
rúbrica general de la psicología social. Entre otras cosas, se ocupa de cómo se influye en las personas
para que cambien sus actitudes, creencias y conductas; cómo forman impresiones de otras personas; por
qué se gustan; las raíces de la agresión y la violencia; y las condiciones que determinan el altruismo y la
ayuda. La lista podría duplicarse fácilmente. Pero con pocas excepciones, los temas que estudian los
psicólogos sociales tienen que ver con el impacto de la sociedad (otras personas) en el comportamiento
del individuo.
Muchos experimentos están motivados por hechos reales de importancia social. Por ejemplo, más
adelante en el capítulo describiremos el trabajo estimulado por el asesinato de Amidou Diallo, un hombre
negro baleado 41 veces por policías blancos. Diallo estaba alcanzando su billetera; los oficiales creyeron
que estaba buscando un arma. Las absoluciones de los oficiales provocaron protestas, leyes y litigios,
todos dirigidos a los posibles prejuicios raciales en la actuación policial. ¿Podrían los oficiales de policía
haber sido predispuestos por la raza de Diallo? Es decir, ¿el hecho de ser negro jugó un papel clave en
su identificación errónea de la billetera como un arma? Regresaremos a estas preguntas más adelante
en el capítulo.
La empresa de la psicología científica tiene sólo unos 100 años, y la aplicación del método científico al
estudio de los interesantes y complejos fenómenos de la psicología social es aún más reciente. Los dos
primeros textos sobre psicología social aparecieron en 1908; uno fue escrito por William McDougall,
psicólogo, y el otro fue escrito por EA Ross, sociólogo. En ambos libros, el tratamiento de la psicología
social es muy diferente del enfoque utilizado hoy. Sin embargo, el libro de McDougall tuvo un gran impacto
en el campo de la psicología en general.
Sostuvo con firmeza que el comportamiento social está determinado en gran medida por una
variedad de instintos que son innatos y relativamente no afectados por la historia de una persona en
particular o su situación social actual.
Nadie cree hoy que el instinto pueda explicar el complejo comportamiento social humano en la
forma en que McDougall trató de aplicarlo. Nociones más sofisticadas de cómo interactúan la biología y
la cultura (recuérdese la discusión de los puntos de vista de Hebb en el Capítulo 12) en las relaciones socia
Sherif estaba interesado en cómo los juicios de otras personas afectarían los de una persona que
percibe la luz. Lo que Sherif descubrió a partir de una serie de experimentos fue que los juicios de una
persona sobre cómo se movía el punto de luz estaban muy influidos por los informes de otros
participantes. Si el experimentador (u otro sujeto) hizo que un sujeto esperara que la luz se moviera en
un amplio arco, entonces el sujeto generalmente informaría que, de hecho, parecía moverse en un amplio
arco. Estos experimentos indicaron que los informes de percepción de una persona pueden ser
manipulados por la influencia social de manera dramática y que este proceso puede estudiarse
experimentalmente.
En los experimentos de Sherif, los sujetos se encontraban en una situación bastante ambigua. Tal
vez fueron influenciados fácilmente por otros porque estaban muy inseguros de sus propias percepciones.
¿Podríamos seguir encontrando evidencia de efectos tan grandes de la influencia social en la percepción
y el comportamiento si hiciéramos la situación menos ambigua? Solomon Asch (1951, 1956, 1958)
formuló esta interesante pregunta en sus experimentos históricos sobre la conformidad. Asch (1956)
comentó sobre la importancia del problema de la siguiente manera: “Concediendo el gran poder de los
grupos, ¿podemos simplemente concluir que pueden inducir a las personas a cambiar sus decisiones y
convicciones en casi cualquier dirección deseada, que pueden impulsarnos a llamarlos cierto lo que ayer
tuvimos por falso, que nos pueden hacer investir a la misma acción con el aura de la rectitud o el estigma
de lo grotesco y la maldad? (pág. 2). La respuesta a esta pregunta proporcionada por sus experimentos
fue un sí calificado, y la conformidad, que es cómo los grupos influyen en el comportamiento individual
para que el comportamiento esté de acuerdo con las normas sociales, se convirtió en un tema popular
en la psicología social siguiendo el trabajo de Asch.
El procedimiento básico que utilizó Asch fue el siguiente. Un grupo de estudiantes se reunió en una
sala para participar en lo que se describió como un estudio de discriminación visual. Se les mostró una
sola línea y luego tres líneas de comparación. Su tarea era decir cuál de las tres líneas de comparación
coincidía con el estándar. Un ejemplo aparece en la Figura 13.1.
Había siete personas en el grupo en un experimento, pero solo había un sujeto real. Los otros seis eran
cómplices del experimentador, o asistentes. La situación se dispuso de modo que el sujeto real
respondiera siempre con su penúltima respuesta, después de que otros cinco “sujetos” ya hubieran
emitido sus juicios. Todos respondieron en voz alta, para que el resto del grupo supiera la respuesta de
cada persona.
Hubo 18 ensayos; en cada caso, una línea de comparación era igual al estándar.
Se instruyó a los confederados para que dieran la respuesta correcta en 6 de los intentos, pero una
respuesta incorrecta constante en 12 intentos. La cuestión de interés era si el sujeto real en el
procedimiento se ajustaría al juicio del grupo e iría en contra de su o
su propia percepción. La mayoría se conformó con los juicios erróneos del grupo en uno o más de los 12
ensayos. También se utilizó un grupo de control, en el que los confederados no cometieron ningún error;
en estas condiciones, sólo el 5 por ciento de los sujetos reales cometieron un error. Irónicamente, el
estudio clásico de Asch pretendía demostrar que las personas se resisten a la influencia del grupo cuando
tienen la evidencia objetiva de sus sentidos en los que confiar.
De hecho, el 63 por ciento de las respuestas en el estudio de Asch fueron correctas, a pesar de la presión
del grupo en sentido contrario. Los psicólogos sociales, sin embargo, han tendido a enfatizar cuánto se
conformaban los sujetos, probablemente porque la conformidad es más sorprendente o controvertida que
la independencia en la sociedad estadounidense (Friend, Rafferty y Bramel, 1990). Más recientemente,
los resultados de Asch se han extendido al dominio de la memoria. Los sujetos vieron diapositivas de
escenas domésticas comunes; Luego, parejas de sujetos se turnaron para recordar los elementos de las
diapositivas. Sin que el sujeto lo supiera, el otro participante era en realidad un cómplice que
deliberadamente sugirió artículos para el hogar que no habían estado en las diapositivas. De interés fue
el “contagio social de la memoria”; los sujetos luego afirmaron haber visto objetos en las diapositivas que
solo habían sido sugeridos por el cómplice (Meade y Roediger, 2002; Roediger, Meade y Bergman, 2001).
La investigación sugiere que el contagio social también puede distorsionar los recuerdos de los testigos
oculares de los hechos delictivos (Gabbert, Memon y Allen, 2003).
En resumen, los experimentos de Sherif y Asch indican que los juicios grupales pueden tener mucho
poder sobre el individuo. Sin embargo, investigaciones posteriores han descubierto muchos factores que
pueden disminuir la infl uencia del grupo. Por ejemplo, si solo un cómplice, respondiendo antes que el
sujeto, no está de acuerdo con el grupo pero responde correctamente, entonces el sujeto generalmente
tampoco seguirá el ejemplo de la mayoría y responderá con la respuesta correcta.
Aproximadamente al mismo tiempo que Sherif escribía sobre normas sociales, Kurt Lewin también
escribía extensamente sobre psicología social. Lewin proporcionó una explicación teórica del
comportamiento social, conocida como teoría de campo, así como algunos experimentos interesantes.
También estaba bastante preocupado por aplicar el conocimiento que los psicólogos sociales estaban
recopilando para la solución de problemas sociales. Ayudó a fundar el Centro de Investigación de
Dinámica de Grupos (ahora en la Universidad de Michigan) para el estudio de temas como el liderazgo y
la productividad de grupos. También desempeñó un papel importante en el establecimiento del
"entrenamiento de la sensibilidad" como un método para hacer frente a las relaciones humanas complejas.
Hoy en día, la psicología social es una de las subdisciplinas más grandes dentro de la psicología
científica. Los psicólogos sociales emplean métodos experimentales para tratar de comprender muchos
temas que son de interés para la mayoría de las personas, como la agresión, la atracción, el altruismo y
la ayuda. Pero debido a que la mayoría de la gente está interesada en la psicología social
Durante miles de años, la experiencia cotidiana del hombre con objetos que caen no fue
suficiente para llevarlo a una teoría correcta de la gravedad. Se necesitó una secuencia de
experiencias hechas por el hombre muy inusuales, los llamados experimentos, que surgieron de
la búsqueda sistemática de la verdad para lograr un cambio de conceptos menos adecuados a
conceptos más adecuados. Por lo tanto, parece injustificable suponer que la experiencia de
primera mano en el mundo social conduciría automáticamente a la formación de conceptos
correctos oa la creación de estereotipos adecuados. (págs. 60 y 61)
también difieren. Sin embargo, en un diseño entre sujetos, hay al menos otra diferencia en las
condiciones, que está incorporada: diferentes grupos de personas se prueban en las dos condiciones
Cuando no es posible controlar una variable, como ocurre con las personas en un diseño
entre sujetos, el experimentador aleatoriza la variable para descartar su infl uencia. Por lo tanto, si
se usa un diseño entre sujetos, el investigador asigna aleatoriamente a los participantes a las
condiciones. (La asignación se basa en algún esquema que garantiza una verdadera aleatorización,
Milgram.
Stanley
1965
por
©
que uno de ellos iba a ser el maestro y el otro el alumno en un estudio científi co de este tema.
Los hombres sacaron tiras de papel de un sombrero para determinar quién iba a aparecer en qué
rol, pero en realidad, el dibujo fue manipulado de modo que el participante ingenuo siempre fuera
el maestro y el cómplice siempre el aprendiz. El experimentador fue interpretado por un profesor
de biología bastante severo de 31 años que vestía una bata blanca de laboratorio. El alumno fue
atado a una silla eléctrica para evitar el movimiento excesivo, y se colocaron electrodos en sus
muñecas con pasta "para evitar ampollas y quemaduras". En respuesta a una pregunta del
alumno, el experimentador dijo: “Aunque las descargas pueden ser extremadamente dolorosas,
no causan daños permanentes en los tejidos” (Milgram, 1963, p. 373).
Se pidió a los profesores-participantes que leyeran una lista de pares asociados al aprendiz
(ver Capítulo 10) y luego que lo pusieran a prueba en la lista presentando un estímulo y cuatro
alternativas, una de las cuales era correcta.
Se le pidió al alumno-cómplice que eligiera la respuesta correcta de entre las cuatro
alternativas y la dijera en voz alta. Si cometía un error, se le indicaba al maestro-participante que
le aplicara una descarga eléctrica presionando un interruptor en un imponente generador de
descargas. Aunque el cómplice en realidad no recibió descargas, al participante real se le dio una
descarga de muestra leve al comienzo del experimento para convencerlo de que el generador
era real. Durante el transcurso del experimento, se pidió a los profesores que aumentaran la
cantidad de descargas cada vez que el alumno cometía un error. La medida dependiente principal
fue la cantidad de descarga eléctrica que el participante ingenuo estaba dispuesto a dar. El
generador de choque constaba de 30 interruptores de palanca, claramente etiquetados como
procedentes de 15 a 450 voltios. Hubo siete interruptores (en cada uno de los cuatro grupos) y a
los participantes se les dieron las siguientes descripciones verbales de las etiquetas de los
interruptores (de izquierda a derecha): descarga leve, descarga moderada, descarga fuerte, descar
100%
90%
Maestro Víctima
80%
Recibe Libras
70% en Víctima
Muestra
Choque Muro Libras
60% en
50% Muro
Otra vez
choque
nivel
cada
de
en 40%
30%
20%
10%
Porcentaje
obedecen
personas
órdenes
que
de
0%
Muy
): XXX
Leve
Fuerte Fuerte
Intenso Severo Choque
Intensidad
Extremo Peligro
Moderado
Es posible que haya notado que falta algo en la descripción del estudio de Milgram, algo crucial para
un experimento. No hubo variación de una variable independiente en la investigación. Por lo tanto, no
se obtuvo información sobre las condiciones que mejoran o disminuyen la obediencia a la autoridad en
esta situación. Aunque Milgram empleó un entorno controlado para producir obediencia en el laboratorio,
es mejor referirse a su primer estudio como una demostración que como un experimento, ya que no
hubo manipulación de una variable independiente. Milgram, por supuesto, se dio cuenta de esto y no
afirmó lo contrario.
En el informe original, describió áreas en las que las variaciones sistemáticas en el procedimiento
podrían conducir a nueva información útil sobre las condiciones necesarias para la obediencia; también
proporcionó algunas de estas variaciones en experimentos posteriores.
Un factor que podría haber fomentado la obediencia en el estudio original fue el entorno; se llevó
a cabo en la Universidad de Yale, una institución presumiblemente muy apreciada por los participantes
(al menos antes del experimento). Quizás el aura general de Yale ayudó a fomentar la obediencia, ya
que presumiblemente esta conocida institución no permitiría que sus instalaciones se usaran con fines
turbios. Milgram (1965) informó sobre un estudio posterior similar al original en la mayoría de los
detalles, excepto que se realizó en un viejo edificio de oficinas en una parte bastante sórdida de
Bridgeport, Connecticut, bajo los auspicios de Research Associates of Bridgeport, una empresa ficticia.
empresa. Aunque el cumplimiento se redujo en el estudio de Bridgeport (el 48 por ciento administró la
descarga máxima frente al 65 por ciento en el
En experimentos reales posteriores, se ha encontrado que otras variables tienen un gran efecto
sobre la obediencia. Cuando otras personas sirven en el experimento como maestros que se supone que
deben proporcionar descargas (aunque en realidad son cómplices), su comportamiento afecta
notablemente al del participante ingenuo. En un caso, Milgram (1965) hizo que los dos confederados se
negaran a continuar en niveles predeterminados de shock. Los resultados se muestran en la figura 13.4,
lo que indica que las personas ingenuas estaban mucho más capacitadas para negarse a continuar
cuando otros lo hacían. Por otro lado, en otro experimento, cuando dos compañeros conformistas
alentaron a los sujetos ingenuos a aumentar el nivel de descarga, administraron una descarga mucho
mayor que cuando determinaron ellos mismos el nivel de descarga (Milgram, 1964a).
Otra manipulación interesante que intentó Milgram (1965) fue variar la cercanía de la víctima, de
modo que en una condición el maestro solo podía escuchar a la víctima gemir y quejarse; en otra
condición, estaba en la misma habitación para poder ver también a la víctima; y en otra condición más,
se instruyó al participante para forzar el brazo del aprendiz hacia abajo sobre la placa de choque de metal
en cada prueba (Figura 13.5). Aunque la obediencia disminuyó con la cercanía de la víctima, del 74 por
ciento al 40 por ciento y al 30 por ciento obedeciendo las instrucciones del experimentador hasta el final
en las diferentes condiciones, aún es notable que casi un tercio continuó dando las descargas incluso
cuando tenían que hacerlo. sostenga la mano de la persona.
La investigación de Milgram sobre la obediencia nos permite ver cómo se puede investigar un
problema interesante y complicado relacionado con la influencia social en el contexto relativamente controlado
100%
90%
60%
primer confederado
50%
desafía al experimentador
40%
choque
nivel
cada
de
en
30%
Persona con dos compañeros desafiantes
20%
segundo confederado
Porcentaje
obedecen
personas
órdenes
que
de 10%
0%
desafía al experimentador
Muy
): XXX
Leve
Fuerte Fuerte
Intenso Severo Choque
Intensidad
Extremo Peligro
Moderado
La presión de grupo como influencia en el desafío a la autoridad. Cuando las personas no cuentan
con el apoyo de sus compañeros, el 65 por ciento sigue obedeciendo las órdenes del experimentador de
aplicar descargas cada vez más fuertes durante todo el experimento. Cuando las personas están con
compañeros que desafían al experimentador, solo el 10 por ciento sigue obedeciendo las órdenes del
experimentador. (De Social Psychology: Understanding Human Interaction [p. 297], por RA Baron y D.
Byrne, 1977, Boston: Allyn and Bacon.)
Milgram.
Stanley
1965
©
ÿ FIGURA 13.5
Un participante obediente que golpea a un cómplice mientras fuerza su brazo contra la placa de metal.
De THE OBEDIENCE distribuido por Pennsylvania State University Media Sales.
Los experimentos psicológicos típicamente emplean tanto control experimental como puede reunir el
investigador prudente. Esta sección se ocupa de dos fuentes de sesgo que incluso el investigador más
concienzudo puede pasar por alto: el sesgo introducido por los experimentadores y por los propios
sujetos. El problema del sesgo del experimentador
es potencialmente prevalente en todas las ciencias. La forma más flagrante de sesgo es la falsificación
deliberada de datos. Las presiones sociales que existen para ser productivos, publicar muchos artículos
y encontrar resultados espectaculares para recibir más dinero de las agencias de subvenciones han
llevado a algunos investigadores a obtener resultados falsos. Broad y Wade (1982) consideran varios
casos documentados de tal fraude y analizan el problema en detalle. Desafortunadamente, no se puede
hacer mucho para reducir este tipo de fraude, excepto estar alerta y castigar a los infractores cada vez
que se los descubra. Dichos fraudes pueden descubrirse cuando otros investigadores intentan replicar
y confirmar el trabajo. En el Capítulo 4 se analizan consideraciones adicionales sobre el fraude en la
investigación.
El problema del sesgo del experimentador, aunque potencialmente peligroso, puede no ser tan
grave como a veces se supone. Barber y Silver (1968) analizaron exhaustivamente la investigación
sobre los efectos de las expectativas del experimentador y argumentan que todavía no hay suficiente
evidencia para concluir que tales efectos son fenómenos probados. Independientemente de la
validez de esta afirmación, otros factores nos hacen creer que a menudo se exagera la importancia
de los efectos del experimentador. Hemos enfatizado repetidamente a lo largo de este libro que los
resultados de cualquier experimento individual deben verse en el contexto de otros experimentos
similares antes de poder hacer una generalización. Si un resultado experimental en particular se
considera importante, uno puede estar seguro de que gran parte de la investigación futura estará
dirigida a descubrir las condiciones bajo las cuales se da, explicar los mecanismos involucrados, etc.
En el curso de tal investigación, habrá muchas ocasiones para que el fenómeno básico sea replicado
por experimentadores con muchos puntos de vista diferentes sobre el tema, algunos con la
esperanza de encontrarlo, otros con la esperanza de no encontrarlo. Si el fenómeno es replicado
por todos, entonces podemos asumir que no es producido por el sesgo del experimentador; si no,
podemos sospechar que el sesgo del experimentador es responsable de parte de la dificultad. El
punto importante es que el sesgo del experimentador, o incluso la flagrante deshonestidad de un
investigador aislado, se descubrirá en el curso normal de la investigación científica. Esos efectos
aún deben evitarse con toda la precaución posible, por supuesto. A la larga, sin embargo, los efectos
del sesgo del experimentador probablemente se eliminarán en el proceso científico.
Una fuente de sesgo potencialmente más poderosa, que es exclusiva de las ciencias sociales,
tiene que ver con el participante y lo que espera encontrar en un experimento psicológico. Martin
Orne (1962, 1969) fue un pionero en concienciar a los psicólogos sobre este problema. Señaló que
las personas que participan en un experimento tienen algunas nociones generales de qué esperar y
probablemente están tratando de descubrir el propósito específico del experimento. Es probable que
crean que se tomarán las precauciones razonables para su bienestar y que cualquier cosa que el
experimentador les pida que hagan tendrá un propósito útil. También querrán conocer este propósito
y buscar pistas en la situación experimental. Debido a que muchos experimentos psicológicos,
especialmente los de psicología social como los estudios de obediencia de Milgram, proporcionarían
resultados poco interesantes si se conociera el verdadero propósito del estudio (pronto todos se
negarían a obedecer al experimentador),
Si los resultados de un experimento son producidos por las características de demanda de la situación
experimental, no se generalizarán a otras situaciones. Es bien sabido que el conocimiento de alguien de
que él o ella es parte de un experimento afectará en gran medida su comportamiento. En “Psicología en
acción” al final del capítulo, sugerimos un ejercicio que puede realizar para demostrar este punto.
En todos los experimentos de laboratorio, las personas se dan cuenta de que están siendo
observadas y que su comportamiento está siendo monitoreado cuidadosamente. Sus expectativas de
cómo se supone que deben comportarse pueden determinar en gran medida su desempeño en el
experimento. Otro fenómeno de este tipo es bien conocido por los investigadores médicos; se llama efecto
placebo. Esto se refiere al hecho de que cuando a los pacientes en investigación médica se les da una
sustancia químicamente inerte y se les dice que es la medicina la que debería ayudarlos, a menudo
muestran una mejoría en la enfermedad o encuentran alivio de su dolor. Por lo tanto, cuando se evalúa un
fármaco en la investigación médica, no es suficiente comparar un grupo de pacientes que recibe el fármaco
con un grupo que no lo recibe, porque los pacientes que reciben el fármaco pueden mejorar simplemente
por el efecto placebo (ver Capítulo 6). ). En su lugar, el grupo de fármaco también se compara con un
grupo de placebo para que el efecto del fármaco pueda medirse en relación con el efecto placebo. El
término experimento simple ciego
a menudo se aplica a este tipo de investigación porque las personas, en este ejemplo, no saben si están
recibiendo medicación o un placebo. Las salvaguardas experimentales generalmente se extienden en la
investigación médica para que los médicos que administran los medicamentos también estén ciegos al
tratamiento de los pacientes. La ventaja de este tipo de experimento doble ciego es que ni las
expectativas de mejora de los pacientes ni de los médicos pueden afectar los resultados.
En una línea de investigación de laboratorio, Orne (1962) trató de encontrar una tarea que fuera tan
aburrida y sin sentido que los participantes normales se negaran a realizarla. Estaba interesado en
encontrar tal tarea porque luego quería ver si los participantes bajo la influencia de la hipnosis realizarían
o no la tarea cuando se les indicara que lo hicieran. Un experimento consistió en dar a los sujetos 2000
hojas de papel llenas de filas de dígitos aleatorios. Se instruyó a las personas para que sumaran los
muchos pares de dígitos en cada fila en todas las hojas. Claramente, era una tarea imposible; Orne asumió
que la gente de control se daría cuenta rápidamente de esto y se negaría a continuar. Pero en cambio, la
gente, que se vio privada de sus relojes, se mantuvo en la tarea durante horas y horas, con poca
disminución en el rendimiento. A las personas en un estudio posterior (que tenía como objetivo hacer la
tarea aún más onerosa y sin sentido) se les dijo que después de completar cada hoja, debían tomar una
tarjeta y seguir las instrucciones escritas en ella. Cada tarjeta les indicó que rasgaran
ÿ TABLA 13.1
Hipnosis real 83 83 83
para cumplir
No experimental 0 0 0
Los problemas de las características de la demanda en entornos de laboratorio, junto con otros
factores, han provocado que muchos psicólogos sociales recurran a la investigación de campo. En
lugar de intentar traer algún fenómeno al laboratorio para estudiarlo en un entorno controlado, el
investigador intenta introducir suficiente control en un entorno (en "el campo") para permitir que se
hagan inferencias sobre cómo las variaciones en una variable independiente afectar una variable
dependiente. En tales casos, no hay problema de generalizar al mundo real; para empezar, el
experimento se lleva a cabo en el mundo real. Sin embargo, en cierto modo, la investigación de
campo en psicología social es aún más difícil de concebir y llevar a cabo que la investigación de
laboratorio. Discutiremos algunos de estos problemas antes de examinar un estudio de campo.
Kitty Genovese es atacada por un maníaco cuando regresa a casa del trabajo a las 3 a.m.
Treinta y ocho de sus vecinos en Kew Gardens se acercan a sus ventanas cuando ella
grita de terror; ninguno acude en su ayuda a pesar de que su acosador tarda más de
media hora en asesinarla. Nadie ni siquiera llama a la policía. Ella muere.
Otros once jinetes observan al chico de diecisiete años mientras se desangra; ninguno acude en su ayuda a
pesar de que sus atacantes han abandonado el coche. Él muere.
Una telefonista de dieciocho años, sola en su oficina en el Bronx, es violada y golpeada. Escapando
momentáneamente, corre desnuda y sangrando hacia la calle, gritando por ayuda. Una multitud de cuarenta
transeúntes se reúne y observa cómo, a plena luz del día, el violador intenta arrastrarla escaleras arriba; nadie
interfiere. Finalmente, dos policías pasan y arrestan a su agresor.
Estas viñetas están tomadas textualmente de un libro fascinante de Bibb Latané y John Darley
llamado The Unresponsive Bystander: Why Doesn't He Help? (1970, pp. 1-2), en el que describen
su investigación destinada a responder a esta pregunta. Aunque potencialmente hay muchas
razones por las que el transeúnte no puede ayudar en tales situaciones de crisis, una que surgió
al principio de esta investigación tenía que ver con la cantidad de transeúntes. Cuantas más
personas observen una crisis y sean ayudantes potenciales, es menos probable que un espectador
ayude a la víctima. Los psicólogos sociales llaman a esto el efecto espectador.
En un experimento de laboratorio (Darley y Latané, 1968), se hizo creer a los participantes que
estaban participando (a través de un sistema de intercomunicación) en una discusión sobre
problemas personales en la vida universitaria, con uno, dos o cinco estudiantes más. El
experimentador abandonó la escena después de que la persona recibió instrucciones. La
discusión comenzó con la presentación de los estudiantes, pero de repente uno de los estudiantes
comenzó a actuar, de una manera muy convincente, como si estuviera sufriendo un ataque
epiléptico. (En realidad, solo un verdadero participante participó a la vez; las otras voces que se escuc
El interés estaba en ver cómo se comportarían cuando pensaran que había cero, uno o cuatro
transeúntes más. Los resultados se muestran en la Tabla 13.2, donde se puede ver que el
porcentaje de personas que intentaron ayudar al extraño disminuyó a medida que aumentaba el
número de otros transeúntes. Incluso cuando las personas respondieron a la emergencia, fueron
más lentas cuando pensaron que otros también estaban presentes en la situación. Aparentemente
hay una “difusión de responsabilidad”, de modo que cuantas más personas estén presentes
(y más personas haya para presenciar potencialmente cómo uno se pone en ridículo), menos se
siente obligado cualquier individuo a intervenir. Un estudiante en una clase con otros 100
estudiantes se siente menos responsable de responder la pregunta de un instructor que un
estudiante en una clase con otros cinco.
ÿ TABLA 13.2
Número de segundos
Número de Porcentaje de participantes Transcurriendo antes de Persona
Transeúntes percibidos Tratando de ayudar a un extraño intenta ayudar
1 85 52
2 62 93
5 31 166
Algunas de las predicciones eran que sería más probable que las personas ayudaran a una persona de
su propia raza que a una de otra raza, que la ayuda se brindaría más probablemente cuando la víctima fuera
percibida como enferma en lugar de borracha, y que la tendencia a ayudar sería mayor. disminuye con el
número de observadores. Curiosamente, estas predicciones (que parecen estar de acuerdo con el sentido
común) solo se verificaron parcialmente. Hubo una clara tendencia a ofrecer ayuda más fácilmente a las
víctimas enfermas que a las ebrias (en el 95 por ciento de los ensayos para la víctima enferma frente al 50 por
ciento para la víctima ebria). Pero en ambas condiciones, el número de observadores no afectó de ninguna
manera la probabilidad de que se ofreciera ayuda o la velocidad con la que se ofreció. Además, la raza de la
víctima enferma no afectó si una u otra raza ayudó. Sin embargo, cuando la víctima estaba borracha, las
personas de la misma raza ayudaron a la víctima más que las personas de una raza diferente.
¿Cómo podemos determinar cuáles son estos factores? Primero, el investigador tendría que formular
hipótesis para responder a esta pregunta: ¿Cuándo un mayor número de espectadores reduce la disposición
de otras personas a intervenir? Después de decidir qué variables pueden ser importantes, el experimentador
debe variarlas sistemáticamente para ver qué influencia influye en la intervención de los espectadores cuando
hay diferentes números de espectadores presentes. En este caso, el experimentador estaría buscando una
interacción entre el número de espectadores y algún otro factor que está tratando de descubrir.
Otra lección que se puede extraer de los estudios de intervención de espectadores es que las respuestas
de los demás determinan en gran medida lo que percibimos como la realidad social de una situación. Si otras
40 personas se quedan mirando un asesinato, tú y yo también lo haremos. Tal comportamiento se considera
apropiado, ya que todos los demás lo están haciendo. ¿Por qué arriesgar nuestros cuellos, cuando todos estos
otros podrían ayudar? ¿Dónde está la policía cuando la necesitas? Las investigaciones han demostrado que si
se hace que las personas se sientan responsables de una crisis o ven a alguien más intervenir, es más probable
que intervengan (Moriarity, 1975). El tipo de evento también importa. En un estudio, era más probable que se
produjera un efecto de espectador cuando las personas presenciaban a un confederado pintando graffiti en un
ascensor que cuando lo veían tirando basura en un parque público (Chekroun & Brauer, 2002). Presumiblemente,
la gente sentía más responsabilidad por el parque público compartido que por el ascensor corporativo.
En el Capítulo 10 ("Recordar y olvidar"), leíste acerca de las pruebas de memoria implícita que permiten
a los psicólogos medir la memoria sin pedir explícitamente a las personas que recuerden el episodio de estudio.
Los psicólogos sociales han adoptado un enfoque similar, creando medidas de actitud implícitas que les
permiten observar correlatos hipotéticos de prejuicio sin pedir explícitamente a los sujetos que informen sobre
sus actitudes.
Una medida reciente de actitud implícita fue impulsada por un hecho real, el asesinato de un inmigrante
negro por parte de policías blancos. Como se describió anteriormente en el capítulo, en febrero de 1999, cuatro
oficiales de la policía de la ciudad de Nueva York le dispararon 41 veces a Amidou Diallo cuando buscaba su
billetera. Diallo estaba desarmado, pero la policía disparó porque creyeron que estaba tratando de sacar un
arma. ¿Es posible que los agentes de policía hayan sido parcializados por la raza de Diallo? Es decir, ¿podría
el hecho de que él sea negro haber afectado su identificación errónea de la billetera como un arma?
Para estudiar esto experimentalmente, Payne (2001) creó un experimento de cebado con la siguiente
estructura: en cada prueba, una cara se mostró brevemente en la pantalla durante 200 ms, seguida de un
objeto presentado durante 200 ms. Las máscaras visuales comenzaron y terminaron cada ensayo.
La cara principal era negra o blanca, y el objeto objetivo era un arma o una herramienta. La tarea de los
sujetos (blancos) era ignorar las caras y presionar una tecla si el objeto era un arma y otra si era una
herramienta. Este procedimiento se representa en la figura 13.6. En uno
(a)
Schulke/
Corbis
Flip
© O Hamburguesa/
Images
Harriet
Getty
©
(b) (C)
O
Edmundson/
Images
Getty
Paul
© Images
Krejci/
Getty
Ume
©
(d) (y)
(a)
ÿ FIGURA 13.6
En cada prueba, se mostró brevemente una cara negra o blanca, seguida de una pistola o herramienta. Las máscaras
visuales comenzaron y terminaron cada ensayo. La tarea consistía en presionar una tecla que indicaba "pistola" o "herramienta".
Adaptado de Payne (2001).
En el experimento 2, debido a que los sujetos tenían que responder rápidamente (en menos de 500 ms),
cometieron más errores que en el primer experimento. Ahora puede ver evidencia de sesgo racial en los datos de
error. Los datos se muestran en el lado derecho de la Figura 13.7. En general, los sujetos tenían más probabilidades
de cometer errores con las herramientas que con las armas, llamando erróneamente a las herramientas "armas". Sin
embargo, de manera crítica, los sujetos identificaron erróneamente más herramientas como pistolas después de una
cara negra que después de una cara blanca.
Volviendo al caso de Amidou Diallo, se puede imaginar que los policías reaccionaron rápidamente y bajo estrés.
Los datos de Payne sugieren que cuando las personas responden rápidamente, ver a una persona negra aumenta la
probabilidad de percibir erróneamente un objeto inofensivo como un arma. Cuando tienen prisa, las personas se ven
obligadas a confiar en los estereotipos (que pueden actuar como una heurística o un atajo); desafortunadamente, los
estadounidenses tienen el estereotipo de que los negros son peligrosos (Devine & Elliot, 1995). El paradigma arma-
herramienta se está volviendo
Negro Negro
Blanco Blanco
460 0.4
450
0.3
440
reacción
Tiempo
(ms)
de
430 Proporción
errores
de
0.2
420
0.1
410
400 0
armas Instrumentos armas Instrumentos
ÿ FIGURA 13.7
El panel izquierdo muestra los resultados del primer experimento de Payne, en el que a los sujetos se les dio todo el
tiempo necesario para tomar sus decisiones sobre armas y herramientas. El sesgo racial estuvo presente en los datos
del tiempo de reacción; los sujetos fueron particularmente rápidos para responder a las armas cuando habían sido
precedidos por una cara negra. El panel derecho muestra los resultados del segundo experimento, en el que los
sujetos tenían que responder rápidamente. Ahora cometieron errores: críticamente, era más probable que identificaran
erróneamente una herramienta como un arma después de haber visto una cara negra. Adaptado de Payne (2001).
Problema ¿Las personas se desempeñan mejor cuando trabajan en una tarea con otras
personas?
Esta es una consideración importante en la industria, por ejemplo. ¿Deberían diseñarse los
trabajos de modo que las personas trabajen solas o en grupos? ¿Existen condiciones bajo las
cuales el desempeño individual puede verse favorecido u obstaculizado por otros? ¿Cuáles
son esas condiciones?
Hipótesis Cuando una persona comparte la responsabilidad de una tarea con otras, se
desempeñará mejor en la tarea que si la realiza sola.
Para probar esta hipótesis, primero debemos encontrar una tarea apropiada para que la gente
la realice en el laboratorio. Debemos seleccionar algo que se pueda realizar tanto solo como
con un grupo de personas. Además, la tarea debe tener un resultado que sea medible y
comparable tanto en situaciones individuales como grupales. Por ejemplo, supongamos que la
tarea fuera diseñar un mejor teléfono para discapacitados. Naturalmente, esperaríamos que la
mayoría de los diseños grupales fueran mejores que los diseños de la mayoría de los individuos
(con la excepción, quizás, de algún genio ocasional). Pero, ¿cómo compararíamos el
desempeño de cada individuo que trabaja en el grupo con su desempeño trabajando solo?
Cuando trabaja solo, el individuo es el único responsable del producto. Cuando se trabaja en
grupo, el individuo es miembro de un equipo y contribuye solo parcialmente al producto final.
Sería difícil determinar cuánto contribuye el individuo al producto del grupo en relación con su
producto individual. Lo que necesitamos es una tarea que sea esencialmente la misma, ya sea
que se realice solo o en grupo.
Una pregunta interesante que surge en relación con este experimento es si el tamaño del grupo
afecta el desempeño individual. Por ejemplo, si creemos que la presencia de otras personas
facilitará el desempeño, entonces tal vez cuanta más gente esté presente, más se facilitará el
desempeño.
Hipótesis Cuanto más grande sea el grupo trabajando juntos, mayor será la
mejora en el desempeño de los individuos.
Podemos probar fácilmente esta hipótesis con nuestra tarea de tirar de la cuerda. Simplemente
podemos variar el tamaño de los grupos que evaluamos: grupos de dos, tres, cinco y ocho sujetos.
Ahora, resumamos las variables experimentales hasta ahora. Tenemos dos variables
independientes, tamaño del grupo (dos, tres, cinco u ocho) y entorno social (solo versus con el
grupo). El tamaño del grupo será un factor entre sujetos; no podemos manipular esto dentro de los
sujetos porque los grupos son de diferentes tamaños, por lo que, por definición, debemos tener
diferentes personas en cada grupo. Se comparará el entorno social dentro de los sujetos: cada
persona realizará la tarea de tirar de la cuerda solo y también con un grupo.
Nuestra variable dependiente será la fuerza total ejercida por los miembros del grupo. En la
condición de solo, las puntuaciones de los individuos se sumarán para obtener la puntuación total.
Hay una dificultad con esta medida, ahora que hemos decidido comparar grupos de diferentes
tamaños. Las fuerzas totales serán mucho mayores en los grupos más grandes que en los más
pequeños, ya que más puntuaciones contribuyen al total en los grupos más grandes. Para que los
grupos sean comparables, podemos convertir las puntuaciones de los grupos en proporciones. Es
decir, podemos medir la fuerza total ejercida por el grupo y luego dividirla por la suma de las
fuerzas individuales de los miembros de este grupo. Por ejemplo, si un grupo ejerció 500 libras de
tensión en la cuerda cuando tiraron juntos y un total sumado de solo 400 libras cuando tiraron
solos, la proporción sería de 5:4.
Como recordará del Capítulo 1, se han llevado a cabo experimentos muy similares al
que hemos propuesto: La investigación indica que, de hecho, las personas trabajan menos
en un grupo que cuando están solas. El primer estudio de este tipo (realizado por
Ringelmann, publicado en Kravitz & Martin, 1986) sugirió que los grupos de dos trabajan
solo al 93 por ciento de sus capacidades individuales totales y los grupos de cuatro y ocho
se redujeron al 77 y 49 por ciento, respectivamente. Así, contrariamente a nuestras
predicciones originales (facilitación social), el desempeño de los individuos es menor en
los grupos y se vuelve aún más bajo a medida que aumenta el tamaño del grupo. Este
fenómeno ha sido denominado holgazanería social (Latané et al., 1979) y parece
consistente con la noción de que la responsabilidad se difunde entre los miembros de un
grupo.
¿Nuestro experimento refuta la hipótesis de la facilitación social? De nada. Como han
demostrado investigaciones posteriores, la variable crítica que determina si la presencia
de otras personas facilita o perjudica la
El consejo para el administrador de empresas parecería ser que los grupos de trabajo deben diseñarse de
modo que los resultados de una persona puedan ser observados por otros (para producir facilitación social) y
también para que los esfuerzos de cada individuo puedan evaluarse independientemente de los del grupo (para
evitar la holgazanería social).
ÿ RESUMEN
1. La investigación en psicología social es, en muchos sentidos, 4. El problema de que el comportamiento de los participantes esté
más difícil de realizar que otros tipos de investigación moldeado por las características de la demanda del entorno
discutidos en este libro porque las situaciones examinadas experimental es potencialmente más peligroso que el del
son a menudo bastante complejos, con muchas variables que sesgo del experimentador porque es probable que las
afectan el comportamiento. Por lo tanto, introducir control características de la demanda sean comunes en los
experimental en la situación para que las inferencias sólidas puedan experimentos en diferentes laboratorios. Las características de la d
hacerse acerca de los efectos de diferentes tratamientos expectativas de los participantes sobre cómo deberían
experimentales sobre la variable dependiente a menudo desempeñarse en el experimento. Orne desarrolló algunas
requiere un gran esfuerzo. técnicas ingeniosas para evaluar el efecto de las características
2. El control experimental combate el problema del error de la demanda. Usó grupos de cuasicontrol, como participantes
experimental, o cualquier variación en la variable dependiente simulados, que a menudo permiten a los investigadores evaluar
que no sea causada por la variable independiente. Tales si las características de la demanda afectan un experimento en
factores extraños deben ser controlados particular, pero no cuál sería el resultado del experimento si se
tanto como sea posible equiparándolos a través de las eliminaran las características de la demanda.
condiciones. Si el control no es posible, estos factores deben
distribuirse aleatoriamente entre las condiciones. 5. Una forma de evitar el problema de las características de la
3. Las expectativas tanto del experimentador como de los demanda es realizar un experimento “en el campo” o en un
participantes pueden crear problemas en la investigación entorno natural. Entonces se excluyen las características de
psicológica social (y otras). El experimentador puede sesgar la demanda, ya que las personas ni siquiera son conscientes
sutilmente los resultados de varias maneras, por ejemplo, de que están en un experimento. Muchos psicólogos sociales
tratando a las personas de manera ligeramente diferente en están recurriendo a la investigación de campo, ya que la
las diferentes condiciones. Una solución a este problema es generalidad de los resultados ya no es un problema como lo
que el experimentador esté ciego con respecto a la condición es en la investigación de laboratorio. Sin embargo, también
en el momento de la prueba, pero esto no suele ser factible, pueden ocurrir problemas graves con la investigación de
ya que el experimentador debe proporcionar la manipulación campo. A menudo es difícil manipular de manera efectiva una
experimental de alguna manera. Es probable que se descubran variable independiente mientras se controlan variables
los efectos del sesgo del experimentador en el curso normal extrañas "molestas", y también es difícil saber qué medir, ya
de la investigación científica. que los participantes ni siquiera saben que están en una situación.
ÿ TÉRMINOS CLAVE
ÿ PREGUNTAS DE DISCUSIÓN
1. ¿Por qué el control experimental suele ser más difícil de lograr en minimizar los problemas en situaciones experimentales?
los experimentos de psicología social que en otros tipos de ¿Son estos problemas igualmente probables de ocurrir en todos
investigación? Para ilustrar, haga una lista de variables que los tipos de investigación?
tendrían que controlarse (o aleatorizarse) en un estudio típico de 4. Discuta las ventajas y desventajas de la investigación de campo.
intervención de espectadores que se realiza ¿Le importaría ser el participante involuntario en un experimento
sobre la intervención de un espectador si luego descubriera que
una. en una situación de laboratorio, y sus reacciones en la situación habían sido registradas?
b. en un experimento de campo.
2. Evalúe la siguiente afirmación: “Si una variable extraña corre el 5. Haz una lista de los temas que crees que podrían ser mejor
peligro de confundirse con la variable independiente de interés en estudió
CONEXIONES WEB
Una buena visión general de la psicología social se puede encontrar en:
http://www.sspp.org/what.htm
Este sitio cubre casi todos los aspectos de la psicología social:
http://www.psicologíasocial.org/
Este sitio le permitirá medir sus propias actitudes implícitas hacia los negros y los blancos, los hombres y las
mujeres, los jóvenes y los ancianos, y una variedad cada vez mayor de otros grupos.
https://implicit.harvard.edu/implicit/
ÿ RECURSOS DE LABORATORIO
En este capítulo, leíste acerca de los estereotipos raciales. Hay otros tipos de sesgos que podrías estudiar,
como el sexismo, la discriminación por edad y la homofobia. Langston (2002)
El capítulo 8 describe experimentos sobre estereotipos sexuales. Por ejemplo, a menudo se supone que los
conductores de camiones y los médicos son hombres, mientras que las secretarias y enfermeras son mujeres.
La evidencia de estos sesgos de género se puede encontrar en un examen de los tiempos de lectura de las
personas. Es decir, las personas tardan más en leer oraciones en las que una ocupación estereotípicamente
masculina se asocia con un pronombre femenino que con un pronombre masculino. Por ejemplo, los sujetos
leen la oración "Un abogado debe argumentar su caso con frecuencia fuera de los tribunales" más rápido que
la oración "Un abogado debe argumentar su caso con frecuencia fuera de los tribunales". Además de replicar
este efecto básico, sería interesante pensar en cómo el tamaño del efecto podría diferir entre tipos de personas.
Por ejemplo, ¿cree que los estereotipos de género serían más o menos frecuentes en adultos mayores o
jóvenes? ¿Conservadores o liberales? Hombres o mujeres? También podría pensar en cómo podría modificarse
esta tarea para estudiar otros dominios de estereotipos (p. ej., discriminación por edad).
PSICOLOGÍA EN ACCIÓN
Por supuesto, el pequeño número de participantes en el experimento hace que sea difícil sacar
conclusiones sólidas. Pero probablemente descubras que los amigos a los que se les pide que te
ayuden con un experimento de psicología probablemente sean mucho más cooperativos. Probablemente
harán más actividades, las harán más rápido y harán menos preguntas. Las personas en el grupo de
control probablemente pensarán que has estado estudiando demasiado.
CAPÍTULO 14
AMBIENTAL
PSICOLOGÍA
RESUMEN
TÉRMINOS CLAVE
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
RECURSOS DE LABORATORIO
PSICOLOGÍA EN ACCIÓN: RUIDO Y MEMORIA
En su manual de dos volúmenes sobre psicología ambiental, que tiene más de 1500 páginas,
Stokols y Altman (1987) describen la psicología ambiental como un estudio interdisciplinario del
“comportamiento humano y el bienestar en relación con el entorno sociofísico” (p. 1 ). Además de los
psicólogos que estudian psicología ambiental, un grupo sorprendentemente amplio de investigadores
y profesionales se ha centrado en las interacciones persona-ambiente. Estas personas provienen de
campos como la arquitectura, la geografía, la salud pública, la sociología y la planificación urbana. Esta
diversidad de intereses disciplinarios ha llevado al crecimiento de un campo amplio que incluye el
estudio del comportamiento espacial, el hacinamiento, el estrés y la territorialidad en una variedad de
entornos, incluidas escuelas, residencias, lugares de trabajo, el entorno natural y condiciones extremas.
y lugares inusuales (como los desiertos o el Ártico). Además, muchos investigadores han estudiado
diversas aplicaciones de la psicología ambiental en áreas tales como la conservación de recursos y el
fomento del reciclaje. De esta amplia gama de temas, hemos seleccionado algunos para ilustrar tres
problemas metodológicos.
El problema discutido con mayor profundidad en este capítulo es la generalidad de los resultados.
Un estudio sobre el ruido (Cohen, Glass y Singer, 1973) mostró que los niños que vivían en los pisos
inferiores de un edificio de apartamentos construido directamente sobre una autopista concurrida eran
peores lectores que los niños que vivían en los pisos superiores, donde el ruido el tráfico de paso era
menos intenso. Como resultado de este estudio, los ocupantes del edificio exigieron que se construyera
un techo sobre la autopista (Figura 14.1). ¿El problema justificaba esta demanda? Los investigadores
deben poder demostrar, como lo hicieron Cohen y sus colegas, que las conclusiones extraídas de sus
datos pueden generalizarse de manera significativa.
Un segundo problema que los psicólogos ambientales comparten con los psicólogos
experimentales son los efectos del ruido en el comportamiento. Es más probable que los psicólogos
experimentales aborden este problema con experimentos de laboratorio. Sin embargo, los psicólogos
ambientales generalmente prefieren los estudios de campo, de modo que los cuasi-experimentos
reemplacen a los experimentos verdaderos. Por lo tanto, discutiremos los efectos del ruido de los
aviones y la construcción en los estudiantes que no han sido asignados al azar a las condiciones experim
Un tercer problema, que quizás sea más problemático para los psicólogos ambientales que para
otros investigadores, implica cuestiones éticas en la investigación. El científico tiene la responsabilidad
de garantizar que las personas no sufran daños en la búsqueda del conocimiento. A menudo, sin
embargo, existe cierto grado de riesgo. ¿Cómo, entonces, puede el psicólogo asegurarse de que la
investigación cumpla con los principios éticos establecidos?
Nuestra sociedad otorga un alto valor a la ciencia y la tecnología. El aterrizaje de los astronautas en la
luna simboliza el poder y el prestigio de la ciencia estadounidense. Muchos ciudadanos creen que
nuestro alto nivel de vida, directamente atribuible a dispositivos tecnológicos como automóviles,
televisores y computadoras, seguirá aumentando a medida que la ciencia
Shelden
Cortesía
Cohen
Dr.
del
avances. Por lo tanto, la búsqueda del conocimiento científico está ampliamente justificada sobre la base
práctica de que la ciencia crea una vida mejor para las personas, así como sobre la base filosófica de que
la ciencia, en lugar del arte, la religión, la literatura, etc., ofrece la mejor oportunidad. para encontrar la
verdad.
La psicología aún tiene que lograr tantos éxitos sorprendentes como otras ciencias, como la física y
la química. Por lo tanto, es más difícil justificar los beneficios científicos de la psicología sobre bases
puramente prácticas. Sin embargo, algunas personas afirman que nuestra comprensión de los procesos
físicos, como los relacionados con la energía nuclear, ha superado tanto nuestra comprensión de los
procesos humanos que nos hemos convertido en cautivos de nuestra ciencia, en lugar de beneficiarios. A
medida que la contaminación, el hacinamiento y los problemas ambientales relacionados disminuyen la
calidad de vida, la importancia de las ciencias sociales se vuelve cada vez más obvia. La psicología
ambiental se ocupa de cuestiones que afectan directamente a nuestra vida cotidiana.
Dado que los científicos físicos han logrado logros impresionantes, tanto en la teoría como en la
práctica, parece razonable que los científicos sociales emulen a sus colegas más establecidos.
Prácticamente todos los científicos sociales creen que se pueden descubrir y se descubrirán verdades
poderosas aplicando los métodos científi cos utilizados por los científicos físicos.
La ciencia nos otorgará una mejor comprensión teórica de la naturaleza de la actividad humana, y esto
eventualmente conducirá a una tecnología capaz de mejorar la calidad de vida.
No todos los científicos son conscientes de las limitaciones de la ciencia, a pesar de una breve
exposición a estos puntos como parte de su educación. El científico en ejercicio puede eventualmente
descartar una variedad de puntos filosóficos por tener un valor limitado en su trabajo diario (Medawar,
1969, Capítulo 1).
No obstante, es oportuno presentar la otra cara de la moneda y discutir estas limitaciones. La ciencia
se enfoca solo en ciertas preguntas e ignora otras cuestiones.
Sería extremadamente difícil responder a la pregunta “¿Existe Dios?” científicamente, por lo que la
mayoría de los científicos se contentan con dedicarse a otros asuntos. Del mismo modo, los psicólogos tienden
Weizenbaum (1976) hace esta misma observación utilizando una anécdota sobre un borracho
que buscaba las llaves perdidas. El borracho, arrodillado bajo una farola, es abordado por un oficial de
policía. El borracho explica que está buscando sus llaves, que perdió en algún lugar de la oscuridad.
Cuando el policía le pregunta por qué no mira para allá, el borracho responde que aquí hay más luz
debajo de la farola. La ciencia es un poco como el borracho, ya que mira donde sus herramientas
proporcionan la mejor iluminación.
La psicología ambiental se ve particularmente presionada cuando se aplica esta crítica de la
ciencia. El mundo real, a diferencia del mundo algo artificial de los estudios de laboratorio
cuidadosamente controlados del psicólogo experimental, está repleto de problemas fuera del círculo
de luz que emite una farola. Los psicólogos saben que el progreso científico se produce, de forma lenta
pero segura, si se mantienen dentro de los rayos de la farola hasta que un nuevo avance produzca
una luz más potente. Pero este enfoque tradicional ofrece poca esperanza para la solución rápida de
problemas ambientales apremiantes.
Si los psicólogos ambientales se mueven lenta y tradicionalmente, están abiertos a la crítica de que
su investigación es irrelevante para las necesidades de la sociedad. Esta es una acusación grave, ya
que, en última instancia, la sociedad paga el precio de esta investigación a través de subvenciones de
investigación federales y demás. Por otra parte, el psicólogo desprevenido que se lanza de inmediato
a solucionar los males de la sociedad corre un alto riesgo de obtener resultados que luego pueden
resultar inadecuados. Y si la política pública se formula sobre la base de dicha investigación incompleta
(o de ninguna investigación), el precio para la sociedad puede ser bastante alto (Figura 14.2).
Todos nosotros, ya sea que vivamos en grandes áreas metropolitanas o en comunidades rurales,
tenemos opiniones sobre la calidad de vida urbana. Para algunos, la ciudad representa el apogeo de
la cultura y los logros. Para otros, la ciudad es un pozo negro de violencia, contaminación y ruido.
¿Cómo podemos descubrir la verdad sobre la vida en la ciudad?
Una de las visiones más perspicaces de la vida de la ciudad se puede encontrar en un libro
fascinante, Death and Life of Great American Cities, de Jane Jacobs (1961). Como un ejemplo de su
perspicacia, discutiremos brevemente los puntos de vista de Jacobs sobre las funciones de la acera.
Bettmann
Corbis/
©
ÿ FIGURA 14.2
Demolición de Parte del Proyecto de Vivienda Pruitt-Igoe en St. Louis. Estos edificios,
aunque en buen estado físico, quedaron inservibles para ser ocupados debido al vandalismo.
Desde entonces, la investigación realizada por científicos sociales ambientales ha revelado cómo
prevenir tales tragedias.
Para la mayoría de nosotros, la acera existe para llevarnos de un lugar a otro. La mayoría de
nosotros, incluidos los psicólogos, no hemos pensado mucho en las funciones psicológicas de la
acera común. Jacobs muestra que la acera hace una gran contribución a la interacción social dentro
de la ciudad. Ella señala que los propietarios de pequeñas tiendas que bordean las calles locales
(sastres, farmacias, tiendas de dulces) brindan una multitud de servicios sociales para los usuarios
de las calles del vecindario. Estos servicios van más allá de la naturaleza de cada negocio en
particular. Por lo tanto, un sastre podría estar atento a los niños que corren por la calle y advertir a
sus padres; el dueño de la tienda de golosinas podría dejar que los niños usen sus baños para que
no tengan que correr escaleras arriba; el propietario de la tienda de delicatessen podría recibir
correo de un cliente que está fuera de la ciudad durante unos días. Cada uno de estos servicios por sí so
Pero cuando se suman, argumenta Jacobs, forman la base de sentimientos positivos sobre un
vecindario como un buen lugar para vivir.
Cualquiera que haya vivido en una calle tan anticuada de la ciudad acepta intuitivamente la
verdad de las declaraciones de Jacobs. Sin embargo, sus conclusiones se basan únicamente en la
observación naturalista. Aunque la observación es un origen importante para la ciencia (ver Capítulo
2), un mejor método agregaría credibilidad a sus afirmaciones. No hay nada experimental en la
forma en que Jacobs recopiló sus datos. No se hicieron intentos sistemáticos para manipular
variables dependientes y registrar variables dependientes; no se realizaron réplicas; ninguna
variable de control entra en sus descripciones de comportamiento. Aunque ningún científico
rechazaría sus conclusiones de plano, pocos las aceptarían. La mayoría de los científicos afirmarían
que aún no se ha logrado una prueba adecuada de sus sugerencias, que no son hipótesis claras
que puedan probarse fácilmente. Hasta que se lleven a cabo debidamente los procedimientos
formales requeridos por la ciencia, las conclusiones de Jacobs no pueden ser santificadas como
verdad científica, sino sólo consideradas como posibilidades interesantes.
Un criterio importante para juzgar la utilidad de un experimento es su representatividad. Los experimentos que son
representativos nos permiten extender sus hallazgos a situaciones más generales. Cuando los investigadores descubrieron
que los alquitranes de los cigarrillos causaban cáncer en los beagles de laboratorio, muchos fumadores de cigarrillos
sintieron que tal investigación solo demostraba que los perros no deberían fumar. En resumen, dudaron de la
representatividad de los hallazgos y no creían que los resultados pudieran generalizarse a los humanos. Sin embargo,
estudios posteriores confirmaron estos hallazgos anteriores; ahora, el cirujano general está tan convencido de los peligros
de fumar cigarrillos que todos los paquetes de cigarrillos deben etiquetarse con una advertencia para el usuario.
El experimento cigarrillo-beagle es un ejemplo del problema de generalizar los resultados de una muestra a una
muestra diferente oa una población diferente. Llamaremos generalización a esta muestra. Ocurre en muchas formas. El
organismo humano más estudiado es el estudiante universitario que asiste a una clase de introducción a la psicología y,
como parte del proceso educativo, a menudo se le pide que participe en varios experimentos.
Supongamos que acabamos de completar un estudio sobre diferentes métodos para mejorar la velocidad de lectura y la
comprensión utilizando una pequeña muestra de estudiantes de la Universidad de Rice inscritos en Introducción a la
Psicología. Si tal estudio arroja resultados apropiados, podría tener implicaciones importantes para la educación. Pero
primero, antes de que se puedan hacer estas implicaciones, se deben responder varias preguntas sobre la generalización
de la muestra.
Primero, ¿son estos resultados típicos o representativos de todos los estudiantes de Rice que toman clases introductorias?
¿psicología? Nuevamente, si nuestra muestra consiste solo en estudiantes de primer año de Rice, no podemos
estar seguros de que los estudiantes de último año de Rice produzcan los mismos resultados. E incluso si
nuestros resultados se generalizaran a todos los estudiantes universitarios de Rice, probablemente no valdría
la pena instituir un cambio drástico en la metodología de lectura, a menos que se pudiera demostrar que los
estudiantes universitarios de todo el país podrían beneficiarse. Incluso entonces, podríamos preguntarnos si
los estudiantes de secundaria y primaria podrían usar este nuevo método de lectura. Claramente, un solo
experimento rara vez se generalizará a todas las poblaciones de interés.
También existen problemas similares sobre la generalización de variables independientes y dependientes.
El estrés ambiental puede ser inducido por medios tan diversos como el aumento de la temperatura, el
aumento del nivel de ruido y la privación de sueño a una persona la noche anterior a un experimento. En la
medida en que nuestra preocupación se centre en el estrés ambiental en general, más que en los efectos
específicos del ruido, la temperatura y la falta de sueño, debemos asegurarnos de que estas diferentes
manipulaciones de las variables independientes relacionadas nos permitan hacer afirmaciones representativas
sobre el estrés. Llamaremos a esta variable representatividad. Digamos que nos preocupan los efectos de
la temperatura en los disturbios urbanos: ¿el largo y caluroso verano conduce a la agresión? Cuando esto se
estudia en el laboratorio (Baron & Bell, 1976), encontramos que las altas temperaturas no conducen
necesariamente a una mayor agresión.
Pero antes de que podamos rechazar esta explicación de los problemas urbanos de verano y avanzar hacia
otras hipótesis (p. ej., más jóvenes holgazanean en las calles durante los meses de verano), debemos
asegurarnos de que las medidas independientes y dependientes se generalicen desde el laboratorio a la
escena urbana. La mayoría de nosotros estaríamos dispuestos a aceptar la afirmación
efectos sobre el comportamiento y los sentimientos (p. y la contaminación del aire son ejemplos de este tipo
ej., véase Marshall y Heslin, 1975). Así que la definición de variable independiente.
operativa usual, aunque precisa y clara, es inadecuada,
porque confunde dos variables separadas: número de
personas y cantidad de espacio. Por ejemplo, si la Variables de control
densidad se manipula aumentando el número de
personas y manteniendo constante el tamaño de la Los estudios de psicología ambiental a menudo carecen
habitación, no sabemos si las diferencias observables de las variables de control cuidadoso que se encuentran
se atribuyen mejor a los efectos de la densidad oa los en el trabajo de laboratorio realizado en psicología.
efectos del número de personas. Aunque se controlan las características físicas generales
El problema se complica aún más por el hecho de que del entorno, como la temperatura ambiente, a menudo
la densidad psicológica a menudo no es lo mismo que se pasan por alto las variables de grano más fino, por
la densidad física. La sensación de hacinamiento ejemplo, la posición relativa de los participantes (uno al
depende no solo de la densidad física sino también del lado del otro o cara a cara). Este defecto es
contexto social (Rapoport, 1975). Una discoteca particularmente evidente en los estudios de campo que,
abarrotada tiene asociaciones mucho más agradables por su propia naturaleza, no ofrecen al experimentador
que un vagón de metro igualmente abarrotado. mucho control sobre la situación. Los psicólogos
Otro conjunto de variables independientes ambientales que realizan estudios de campo son
estudiadas por los psicólogos ambientales cae en la conscientes de este problema, pero piensan que la
categoría de estresores: aquellos agentes que producen mayor realidad de la situación de campo en comparación
situaciones estresantes. Ruido fuerte, altas temperaturas, con el entorno de laboratorio más artificial es una amplia recom
ÿ FIGURA 14.3
Tagawa
Estado
Bunji
de
Delevingne/
Boston
Lionel
Stock
©
ÿ FIGURA 14.4
Agresión en una situación fuera del laboratorio. ¿Crees que este es el mismo tipo de
agresión probado en la figura 14.3?
las intensidades y duraciones más largas de las descargas se interpretan como evidencia de una mayor
agresión. ¿Es la agresión involucrada en presionar un botón la misma agresión involucrada en lanzar un
ladrillo a través de la ventana de una tienda o disparar a la policía y los bomberos con un rifle (Figura
14.4)? Aunque el efecto final (dañar a otra persona) parece ser el mismo en la agresión dentro y fuera
del laboratorio, el desorden civil puede agregar otra dimensión a la agresión. Establecer una analogía
física en el laboratorio —como cuando se entrena a las ratas para “acaparar” dinero— no implica
necesariamente una identidad psicológica.
De hecho, es esta considerable dificultad para establecer la representatividad de las variables lo que ha
alejado a muchos psicólogos ambientales de los estudios de laboratorio hacia los estudios de campo, a
pesar del hecho de que los resultados del control experimental son considerablemente menores.
En este capítulo, discutimos cuatro estudios sobre el hacinamiento y examinamos cuidadosamente
cómo se pueden generalizar sus resultados. El primer estudio utiliza sujetos animales; el resto usa
humanos. Los tres estudios en humanos difieren en que uno se basa en datos demográficos
correlacionados por sociólogos, uno usa técnicas de estudio de campo con control experimental en lugar
de control estadístico post hoc, y uno es un experimento de laboratorio.
ÿ FIGURA 14.5
El universo de las ratas estudiado por Calhoun. Tenga en cuenta que los corrales no están todos unidos por rampas, por lo
que dos de ellos se convierten en callejones sin salida. (Reimpreso con permiso del albacea del patrimonio de Bunji Tagawa.)
y a menudo eran comidas por ratas adultas. Las altas tasas de mortalidad tuvieron las mayores
implicaciones para el universo de las ratas. Las ratas macho también exhibieron un comportamiento sexual
extraño. Las ratas más extrañas fueron llamadas "probers" por Calhoun. En lugar de participar en el cortejo
normal de las ratas, estos exploradores perseguían a las ratas hembra hasta sus madrigueras, donde
comían ratas crías muertas. Así, la variable independiente (alta densidad) provocó la evolución de
comportamientos maternos y sexuales extraños (variables dependientes).
Estos resultados son aterradores, por decir lo menos; si se generalizan al hacinamiento humano,
implican fuertemente que el hacinamiento eventualmente destruirá la sociedad tal como la conocemos hoy.
Pero antes de abandonar nuestros apartamentos de gran altura por los espacios abiertos, examinemos
primero un estudio más reciente realizado con primates no humanos.
El trabajo clásico de Calhoun que acabamos de describir estableció un modelo que vincula el
hacinamiento y la agresión. Pero un trabajo más reciente con primates sugiere que un modelo de
afrontamiento es más preciso. Los primates no humanos hacen frente al hacinamiento desarrollando un
comportamiento compensatorio que reduce los encuentros agresivos. Por ejemplo, van Wolkenten, Davis,
Gong y de Waal (2006) observaron monos capuchinos marrones en condiciones de poca aglomeración y
de aglomeración a corto plazo (30 minutos). No encontraron diferencias en los comportamientos agresivos,
Este es el enfoque adoptado por Evans, Palsane, Lepore y Martin (1989), quienes estudiaron el
hacinamiento y el retraimiento social en Pune, India. Estos investigadores plantearon la hipótesis de que las
personas harían frente al hacinamiento retirándose de las interacciones sociales. Esto, a su vez, disminuiría
los lazos sociales, lo que resultaría en una peor salud psicológica. El apoyo social se midió mediante un
cuestionario de 40 ítems diseñado para indicar las relaciones con familiares y amigos. Los síntomas
psicológicos se midieron mediante ítems de entrevista adicionales que preguntaban si se había experimentado
un síntoma en particular en los últimos 2 meses. Los sujetos fueron 175 hombres cabeza de familia que
vivían en Pune, India.
La técnica estadística utilizada para evaluar los resultados fue la correlación. Cuando se utiliza la
correlación para examinar un rango amplio de la variable independiente, es importante evitar la restricción
del rango (consulte el Capítulo 2), que puede producir una correlación baja. Debido a que el estudio se llevó
a cabo en la India, la densidad residencial varió de 11 personas por habitación a 2 personas por habitación,
un rango mayor que el típicamente disponible en los Estados Unidos (Galle, Grove y McPherson, 1972).
La figura 14.6 muestra la correlación entre densidad y síntomas psicológicos y entre densidad y apoyo
social. Ambos coeficientes de correlación son estadísticamente fiables al nivel de significación de 0,05. La
correlación positiva muestra que el aumento de la densidad se asocia con más síntomas psicológicos,
mientras que la correlación negativa muestra que el aumento de la densidad se asocia con menos apoyo
social.
Debido a que este es un estudio correlacional, no podemos concluir automáticamente que la densidad
cause síntomas psicológicos y una disminución del apoyo social. Es lógicamente posible que personas con
estas características hayan optado por vivir en viviendas de mayor densidad. Los estudios demográficos
como este no pueden asignar personas aleatoriamente a diferentes condiciones de densidad, como suele
ser el caso en los estudios de laboratorio. Sin embargo,
Correlación
Densidad
con
la
–.2
–.4
–0.39
Aunque es bastante razonable que los sujetos se sintieran más ansiosos en las condiciones de hacinamiento
donde fueron golpeados y empujados, los autores no interpretan el hallazgo como mayores sentimientos de
escepticismo.
Cuando este estudio se compara con el estudio demográfico de Evans, una conclusión es obvia. Aunque los
estudios que manipulan variables independientes generalmente deben preferirse a los estudios que solo
correlacionan variables, esto no significa necesariamente que cualquier estudio experimental sea automáticamente
superior a cualquier estudio correlacional. La buena investigación, incluso de la variedad correlacional, es siempre
preferible a la investigación deficiente, incluso de la variedad experimental.
Los psicólogos ambientales a menudo se pasean por las estaciones de ferrocarril para observar el
hacinamiento, y un estudio más reciente muestra que los trenes pueden usarse para una investigación cuidadosa.
Evans y Wener (2007) estudiaron a los pasajeros de trenes que viajaban entre Nueva Jersey y Manhattan durante
las horas pico y registraron dos medidas de densidad (densidad de automóviles: personas/número de asientos en
el automóvil; densidad de asientos: personas/número de asientos en fila) y tres medidas de estrés (cortisol salival,
desempeño en la corrección de pruebas y una autoevaluación del estado de ánimo).
Mediante el análisis de regresión múltiple, sus resultados no mostraron correlaciones significativas entre la
densidad de automóviles y el estrés, pero para la densidad de asientos, los tres índices de estrés fueron significativos.
Los viajeros hacen frente a la densidad de automóviles organizándose para evitar la proximidad física con otros
pasajeros cuando sea posible; por ejemplo, un viajero podría optar por permanecer de pie en lugar de ocupar un
asiento vacío entre otros dos pasajeros. Por lo tanto, la proximidad de otras personas cercanas es un factor
estresante mucho más importante que el número de pasajeros en un vagón de tren.
Tema Cuasi-Experimentos
Ilustración Ruido y Rendimiento Cognitivo
Los verdaderos experimentos requieren la asignación aleatoria de participantes a las condiciones
experimentales. Esto puede ser difícil de lograr en el área de la psicología ambiental, por lo que los cuasi-
experimentos (ver Capítulo 3) a menudo se sustituyen por experimentos verdaderos. Esta sección analiza
dos cuasi-experimentos recientes que investigaron los efectos del ruido en estudiantes de primaria y
universitarios.
Un estudio europeo (Hygge, Evans y Bullinger, 2002) aprovechó la apertura y el cierre simultáneos del
aeropuerto de Múnich para crear un cuasi-experimento.
Dos grupos experimentales estaban formados por niños que estaban expuestos al ruido de los aviones en el
antiguo aeropuerto o que estarían expuestos en el nuevo aeropuerto. Dos grupos de control, emparejados en
variables sociodemográficas, no estuvieron expuestos al ruido de los aviones. Los datos se recolectaron en
tres oleadas: la ola 1 fue 6 meses antes de la apertura del nuevo aeropuerto, la ola 2 fue 1 año después y la
ola 3 fue 2 años después. Las pruebas se realizaron en una furgoneta móvil insonorizada para que no hubiera
confusión con los efectos de ruido inmediatos.
La figura 14.7 muestra los resultados de una prueba de memoria a largo plazo en la que los niños
recordaron información un día después de leerla. En el antiguo aeropuerto, la memoria con el ruido de los
aviones era peor antes del cierre del aeropuerto (onda 1). Sin embargo, una vez que el aeropuerto cerró, los
efectos del ruido desaparecieron. Esperaríamos resultados opuestos en el nuevo aeropuerto. En Wave 1 no
hubo un efecto de ruido estadísticamente significativo. Sin embargo, en Wave 3 el rendimiento fue mejor sin
ruido. Estos resultados muestran que el ruido infl uye en la memoria pero que este efecto es reversible cuando
se elimina la fuente de ruido.
Es interesante comparar este cuasi-experimento con un estudio ex post facto (ver Capítulo 2)
del ruido de los aviones alrededor del aeropuerto de Heathrow en Londres. Haines, Stansfeld, Head y
Job (2002) correlacionaron las pruebas estandarizadas de matemáticas, ciencias e inglés con la
exposición al ruido de las aeronaves; la exposición variaba según la distancia desde el aeropuerto. La
exposición se relacionó estadísticamente con puntajes más bajos en las pruebas de lectura y
matemáticas. Sin embargo, cuando se controlaron estadísticamente otras variables socioeconómicas,
esta asociación correlacional desapareció. En general, los resultados de los cuasi-experimentos son
más sólidos que los resultados de los estudios ex post facto porque los científicos prefieren
afirmaciones sobre causalidad a afirmaciones sobre correlación.
Otro cuasi-experimento estudió los efectos del ruido de la construcción en los residentes de los
dormitorios universitarios (Ng, 2000). El nivel de ruido de la construcción del edificio exterior varió en
tres alas de dormitorios (cerca, central, lejos). Se tomaron cuatro tipos de medidas: una encuesta de
cuestionario, registros de actividad autocompletados, registro de rotación de residentes y observación
externa de ventanas abiertas o cerradas. Mayores porcentajes de residentes en las alas más ruidosas
reportaron interferencia con actividades tales como conversaciones telefónicas. Los residentes del ala
cercana informaron que mantenían las ventanas cerradas con más frecuencia que los residentes de
las alas más tranquilas. Sin embargo, mientras que la observación externa objetiva de las ventanas
encontró más ventanas abiertas en las alas más silenciosas, no hubo un efecto o interacción confiable de
1. Un psicólogo ambiental se sienta en una biblioteca llena de gente y mantiene registros detallados de
patrones de asientos.
2. Un psicólogo ambiental hace cintas de video de patrones de asientos en una biblioteca. Estas cintas se mantienen
indefinidamente; los usuarios de la biblioteca no saben que han sido filmados.
3. Una psicóloga experimental les dice a los estudiantes que está interesada en su comprensión lectora cuando en
realidad está registrando la velocidad de sus respuestas en lugar de su comprensión.
4. Un psicólogo social está estudiando la intervención de espectadores en una licorería. Se ha obtenido el permiso del
gerente de la tienda. A la vista de un cliente, un experimentador “roba” una botella de licor. Un segundo
experimentador se acerca al cliente y le pregunta: "¿Lo viste robar esa botella?"
5. Un psicólogo social conecta electrodos de superficie a participantes masculinos con su aprobación previa. A estos
participantes se les dice que los electrodos están conectados a un medidor frente a ellos que mide la excitación
sexual. En realidad, el medidor es controlado por el experimentador. Luego, a los participantes se les muestran
diapositivas de hombres y mujeres desnudos. El medidor da lecturas altas para fotografías de hombres, lo que lleva
a los participantes a creer que tienen tendencias homosexuales latentes.
No hay absolutos en ética, y no podemos afirmar que algunos de estos ejemplos son
claramente éticos y otros claramente no lo son. Sin embargo, las discusiones informales con
nuestros colegas revelaron que solo el número 1 se consideraba inequívocamente ético. Dado
que el psicólogo se limita a observar y no conoce a las personas (en la ficha técnica solo se
representan mediante símbolos), no se considera necesario el consentimiento informado.
Cualquier individuo, psicólogo o no, podría observar fácilmente a estas mismas personas en la
biblioteca. El daño potencial a los participantes es insignificante.
Puede que se sorprenda de que se hayan planteado objeciones a todos los demás ejemplos.
Se pensaba que el número 2 invadía la privacidad personal, ya que las cintas no se borraban
después de que se extraían los datos. El número 3 sería aceptable solo si el experimentador
informara cuidadosamente a los participantes explicando la naturaleza y las razones de este
pequeño engaño. El número 4 se interpretó realmente; un cliente negó haber visto el robo y luego
llamó a la policía tan pronto como salió de la tienda. El investigador tuvo que ir a la comisaría para
rescatar a los experimentadores. El número 5 se consideró poco ético, incluso con el interrogatorio.
No está claro que el daño psicológico potencial de que los participantes pensaran que tenían
tendencias homosexuales ocultas podría eliminarse incluso con un interrogatorio inmediato,
especialmente si realmente tenían tendencias homosexuales latentes que hasta el experimento
habían sido suprimidas con éxito.
Middlemist, Knowles y Matter (1976) realizaron un experimento que generó cierta controversia
ética. Estaban interesados en los efectos del hacinamiento en un baño de hombres. Los hombres
parecen preferir estar separados en los urinarios siempre que sea posible, por lo que los
experimentadores controlaron el espacio entre los hombres en una fila de tres urinarios adyacentes
a un inodoro colocando un balde para trapeador y un cartel de "No usar" en uno de los urinarios. .
Un cómplice del experimentador estaba apostado en uno de los urinarios del final. Se varió la
distancia entre el participante y el cómplice colocando el balde y el letrero junto al cómplice oa un
urinario de distancia. Esto obligó a los participantes a seleccionar un urinario inmediatamente
adyacente a la cabina del baño, por lo que el cómplice estaba al lado del participante o a un
urinario de distancia del participante. Middlemist y asociados razonaron
Un tema que preocupa a casi todo el mundo es el efecto psicológico del ruido en los humanos.
Los aeropuertos, las fábricas y las calles de las ciudades exponen a los ciudadanos a entornos
ruidosos a largo plazo. ¿Cómo podríamos evaluar los posibles efectos de tal exposición al ruido?
Como siempre, se pueden derivar varias hipótesis de este vago problema. Primero, intentaremos
un enfoque de laboratorio formulando una hipótesis que pueda probarse en circunstancias muy
controladas.
Hipótesis La exposición a ruido blanco fuerte (nivel de presión de sonido de 110 decibelios) y
continuo provocará disminuciones en el número y la precisión de los problemas aritméticos
que se pueden realizar en 25 minutos.
Aunque nuestro experimento está bien controlado, tenemos varios problemas cuando
intentamos generalizar los resultados. Si no se obtuvieran efectos del ruido (si el rendimiento
aritmético fuera el mismo para los segmentos de ruido y silencio), se podría argumentar que
una muestra de vida de 25 minutos es demasiado corta para decirnos acerca de un trabajador
que ha estado expuesto a 110 -ruido de decibelios durante 8 horas al día durante muchos años.
Por otro lado, si se obtuvieran efectos del ruido (si el desempeño aritmético fuera peor en los
segmentos de ruido), aún se podría argumentar que eventualmente un trabajador se adapta
a ambientes ruidosos, por lo que si hubiéramos probado a los participantes durante varios
días o semanas, nuestro el efecto inicial podría haber desaparecido. Ahora formularemos
otra hipótesis, para que los resultados puedan generalizarse más fácilmente.
Hipótesis Los residentes de una calle ruidosa de la ciudad (a) se mudarán con más frecuencia y (b)
obtendrán una puntuación más baja en una escala de calificación de satisfacción residencial que los
residentes de una calle tranquila.
Dado que esta hipótesis se ocupa de los efectos a largo plazo de la residencia permanente,
evita los problemas de generalización vistos en el experimento anterior.
Sin embargo, esta hipótesis no es tan precisa como la otra hipótesis. Los niveles de sonido
para calles ruidosas y tranquilas no se especifican de antemano, pero deben medirse durante
el experimento. El experimentador tiene que decidir si medir los niveles de sonido solo en
ciertos momentos, por ejemplo, durante las horas pico, o tomar un promedio de 24 horas.
Esta variable casi independiente no está completamente bajo el control del experimentador.
Además, puede confundirse con cosas como los ingresos y el estatus, ya que es más
probable que las personas con un estatus socioeconómico más bajo residan en calles más
ruidosas.
Las variables dependientes tampoco son del todo satisfactorias. Incluso si los residentes
desean mudarse más a menudo de las calles ruidosas, los factores económicos pueden
Si el experimentador se ve obligado a construir una escala, primero se debe validar la escala, un proceso difícil
y que requiere mucho tiempo. Así, el precio de la mayor facilidad de generalización en este estudio es una
pérdida considerable de control del experimentador.
Cuando comparamos ambos estudios como soluciones al problema planteado al inicio de esta sección,
queda claro que ninguno es perfecto. Esto siempre es cierto con la investigación. Ningún experimento individual
puede responder una pregunta. El científico se ve obligado a centrarse en una hipótesis más específica,
respondiendo así solo a una pequeña parte del problema. Esta es una fuente importante de frustración para
todos los psicólogos, ya que no hay respuestas generales posibles hasta que se juntan muchas piezas
pequeñas, cada una de las cuales corresponde a una hipótesis específica. Un psicólogo ambiental fácilmente
podría dedicar toda su carrera a tratar de comprender el problema del ruido y sus efectos psicológicos. Para
obtener más información sobre la psicología del ruido, consulte Kantowitz y Sorkin (1983), Capítulo 16.
La evidencia de que la contaminación acústica es un peligro para la salud se ha extendido más allá de la
psicología experimental y ambiental. Por ejemplo, los arquitectos ahora se dan cuenta de que sus diseños
deben amortiguar los sonidos (Bronzaft, 1993). Cuando se encuentran citas de investigaciones psicológicas en
revistas de arquitectura, podemos estar seguros de que el mensaje de la psicología ambiental, que el
comportamiento y la salud humanos se ven profundamente afectados por las características del medio ambiente,
está llegando.
ÿ RESUMEN
1. La ciencia no es el único camino hacia la verdad, y actualmente 3. Dado que la mayoría de los psicólogos ambientales prefieren la
solo ciertas partes de la experiencia humana están abiertas al investigación de campo a la investigación de laboratorio, rara
análisis científico. Sin embargo, el método científi co se corrige vez es posible asignar participantes aleatoriamente a
a sí mismo, mientras que otros métodos de corrección de condiciones experimentales y manipular todas las variables
creencias no lo son. Por lo tanto, la ciencia es preferible independientes. Por lo tanto, los cuasi-experimentos y los
siempre que sus herramientas sean apropiadas. estudios ex post facto son más probables.
2. Los experimentos son pasos en el camino hacia el objetivo 4. El ruido de los aviones influye en la memoria, pero este efecto
final del psicólogo de predecir y explicar el comportamiento. se puede invertir cuando se elimina el ruido.
Este objetivo puede lograrse más rápidamente realizando 5. Los psicólogos están sumamente preocupados por los aspectos
experimentos que sean representativos y que puedan éticos de la participación en la investigación. El derecho al
generalizarse a situaciones relacionadas. consentimiento informado no siempre puede otorgarse en la
Dos tipos de representatividad son la generalización de la investigación. En tales casos, el daño potencial a los
muestra y la representatividad variable. Se discuten cuatro participantes debe sopesarse frente al valor potencial de la
tipos de estudios de hacinamiento; los tipos de generalizaciones investigación. Los experimentos que involucren engaño y
que podríamos sacar de cada uno difieren sustancialmente. ocultación deben llevarse a cabo con gran precaución, si es
que se deben realizar.
densidad cuasi-experimento
cuestiones éticas representatividad
después del hecho muestra generalización
generalidad de los resultados variable representatividad
consentimiento informado
ÿ PREGUNTAS DE DISCUSIÓN
1. Un sacerdote, un rabino y un científico caminaban por la playa 3. Corre a la biblioteca y lee los últimos números de Environment
discutiendo si era posible caminar sobre el agua. Como prueba and Behavior and Human Factors.
empírica, el sacerdote y el rabino se adentraron en el océano Estas dos revistas se especializan en investigación aplicada.
mientras el científico Discuta si los artículos que lee se pueden generalizar más
tist observaba con asombro desde la playa. Pronto fácilmente que los artículos publicados en el Journal of
el sacerdote estaba hasta la barbilla, mientras que el rabino Experimental Psychology.
estaba seco de rodillas para arriba. "¿Cómo te las arreglas para 4. Haz una pequeña lista de experimentos poco éticos que te
mantenerte seco?" preguntó el sacerdote. “Tranquilo”, respondió gustaría hacer. Visite a miembros de la facultad que se
el rabino, “camino sobre las rocas”. ¿Qué le dijeron los dos especializan en las áreas de investigación de sus experimentos
clérigos sobre el empirismo al científico cuando regresaron a la y pregúnteles si estarían dispuestos a supervisar los
playa, y cuál fue su respuesta? experimentos. ¿Cuántos miembros de la facultad le dicen que
2. Seleccione dos áreas en las que la ciencia no sea el camino se niegan porque su experimento no es ético? ¿Es esta
adecuado hacia la verdad. Discuta por qué las herramientas de asignación ética?
la ciencia son irrelevantes o inaplicables en estos dos campos.
¿Será posible que la ciencia maneje estas áreas en un futuro
lejano?
CONEXIONES WEB
http://psy.gu.se/iaap/envpsych.htm
Varios enlaces relacionados con la psicología ambiental se pueden encontrar en:
http://www.apa34.org/
ÿ RECURSOS DE LABORATORIO
Langston (2002), capítulo 6, describe un experimento de laboratorio para explorar los efectos del color de la
habitación y el estado de ánimo en las personas. La teoría a probar afirma que el rojo es un color “expansivo” que
hace que las personas presten más atención al entorno externo, mientras que el verde es un color “contractivo”
que induce estados introspectivos. Si bien la variable independiente es clara, existen varias posibilidades para que
las variables dependientes y las tareas se realicen en el entorno coloreado. Si se prueban suficientes tareas
diferentes, existe la posibilidad estadística de que se obtengan resultados significativos falsos. Si desea mejorar la
metodología sugerida por Langston, averigüe cómo realizar un MANOVA (consulte el Capítulo 3 sobre más de una
variable dependiente) con su instructor.
PSICOLOGÍA EN ACCIÓN
Ruido y Memoria
Este ejercicio le brinda varias opciones para investigar los efectos del ruido en dos tipos de
memoria: recuerdo de elementos y recuerdo de prueba. Haz un juego de siete fichas y escribe
un día de la semana en cada una: lunes, martes. . . Domingo. Estas tarjetas serán los estímulos
presentados a sus participantes, y barajará el mazo para reorganizar el orden cada vez que las
presente. En la tarea de recordar elementos, presenta solo seis cartas. El participante debe
nombrar el día que falta. La recuperación del elemento faltante no depende del orden en que se
presentaron los días. En la tarea de recuerdo de la sonda, el participante tiene que recordar el
día que siguió al estímulo de la sonda en la lista. Por ejemplo, si su lista de seis elementos
hubiera sido lunes, viernes, miércoles, domingo, sábado y martes y la sonda fuera sábado, la
respuesta correcta sería martes. En esta tarea, el conocimiento del orden en que se presentaron
los días es crucial.
Nuestra pregunta de investigación es cómo el ruido afecta estos dos tipos de recuperación
de la memoria. ¿Anticipa que el ruido afectará ambas tareas de la misma manera? ¿Importa el
tipo de ruido? ¿Qué pasa con la intensidad del ruido?
El experimento más simple que podríamos idear tendría solo dos niveles de la variable
independiente del ruido: silencio (una condición sin control de ruido) y ruido. La mayoría de los
experimentadores diseñarían un experimento más complejo. Por ejemplo, podrías variar el tipo
de ruido y también su intensidad. Los posibles tipos de ruido incluyen música instrumental,
música vocal, voz, tonos y ruido blanco, un ruido especial que contiene todas las frecuencias.
(Puede crear un sonido muy similar al ruido blanco al sintonizar una radio con el silbido que se
produce cuando el dial está entre estaciones de radio). La intensidad del sonido se mide en
decibelios, a menudo usando la escala A del medidor. (Si su instructor no tiene acceso a un
medidor de nivel de sonido, puede comprarlo a bajo costo en las tiendas Radio Shack).
Si desea variar la intensidad, los niveles de sonido de 55 decibelios (escala A) a 90 decibelios
(A) serían apropiados.
Intencionalmente no estamos especificando las hipótesis para este experimento. Se puede
encontrar más información sobre el recuerdo y el ruido en Banbury, Banbury, Macken, Trembley
y Jones (2001, p. 22) y Jones (1999). Los efectos del tipo de ruido sobre la memoria verbal se
pueden encontrar en Iwanaga e Ito (2002). Puede formular hipótesis sobre la base de su
experiencia con el ruido, como intentar estudiar mientras escucha la radio, o consultando estos
artículos. Resista la tentación de diseñar un experimento que combine muchos tipos e
intensidades de ruido; será demasiado difícil adquirir y analizar tantos datos. En su lugar,
seleccione un subconjunto de estas variables independientes que le parezcan interesantes.
Formule sus hipótesis, obtenga la aprobación de su experimento para garantizar la
protección de los participantes humanos y recopile sus datos. Su variable dependiente será un
porcentaje correcto o errores en las tareas de memoria. Para los autores de este libro, la parte
más emocionante de la psicología experimental es descubrir si los datos respaldan o rechazan las
Diviértete y que al menos algunas de tus hipótesis se confirmen. ÿ
CAPÍTULO 15
FACTORES HUMANOS
Honra a tu usuario
El valor de la vida
PREGUNTAS DE DISCUSIÓN
CONEXIONES WEB
PSICOLOGÍA EN ACCIÓN: ENTENDER EL TRÁFICO
SIGNOS SÍMBOLOS
Definición
Los factores humanos se defi nen como “la disciplina que trata de optimizar la relación entre la
tecnología y lo humano” (Kantowitz & Sorkin, 1983, p. 4). La tecnología puede referirse a algo
pequeño y común, como un abrelatas, o algo grande y esotérico, como una estación espacial. El
común denominador de la tecnología son las personas; todos los sistemas grandes y pequeños
deben ser utilizados por personas. Si tuviéramos suficiente comprensión de cómo opera el ser
humano, en principio podríamos diseñar toda la tecnología para interactuar mejor con las personas.
El papel central de la persona en los factores humanos explica por qué la psicología experimental
ha tenido una infl uencia tan fuerte en la investigación de los factores humanos. Más de la mitad de
los miembros de la Sociedad de Factores Humanos y Ergonomía fueron formados como psicólogos.
Una parte sustancial de los artículos publicados en la revista Human Factors pueden considerarse
psicología experimental aplicada. Comprender cómo funcionan los humanos en entornos aplicados
es un aspecto crucial de la investigación de factores humanos.
El primer mandamiento de los factores humanos es “Honra a tu usuario”. Si hay algo que deberías
recordar dentro de 25 años sobre los factores humanos, es "Honra a tu usuario". Todo lo demás
simplemente embellece este tema dominante.
Antes de que pueda honrar al usuario, primero debe saber quién será el usuario. Diferentes
poblaciones de usuarios tienen diferentes requisitos de factores humanos. Cuando Japón comenzó
a fabricar automóviles, diseñó automóviles para ciudadanos japoneses. Esto creó un problema
cuando los automóviles se exportaron a los Estados Unidos. Los hombres estadounidenses no
podían pisar el pedal del freno sin pisar simultáneamente los pedales del embrague o del acelerador.
En retrospectiva, la razón de este error de diseño fue clara. Los estadounidenses son, en promedio,
físicamente más grandes que los japoneses y tienen pies más grandes. Aunque el espacio entre los
pedales era satisfactorio para el pie japonés más pequeño, los pedales estaban demasiado juntos
para el pie estadounidense más grande. Dado que los pies americanos no se habían especificado en
las características del diseño original, se había violado el primer mandamiento de los factores humanos.
Este mismo error puede ocurrir de formas más sofisticadas. Una gran empresa estadounidense
de telecomunicaciones, muy apreciada por sus esfuerzos en factores humanos, estaba diseñando
un sistema para presentar mensajes grabados por teléfono en momentos especificados por el usuario.
Dado que se especificó el hardware para este esfuerzo, los diseñadores de factores humanos
tuvieron que idear el equivalente de un lenguaje de computadora en miniatura con el que el usuario
pudiera ingresar los comandos apropiados. Así que se seleccionó a informáticos para crear este
nuevo mini-lenguaje. Después de varios meses de esfuerzo, dieron con un lenguaje poderoso que
podía controlar de manera eficiente los mensajes grabados. Además, siendo diseñadores prudentes,
probaron su nuevo sistema utilizando secretarias como sujetos de prueba. Dado que este dispositivo
estaba diseñado para ser utilizado por secretarias, esta era la población de prueba ideal. Por
desgracia, ninguna de las secretarias pudo dominar el nuevo idioma. Después de reflexionar un
poco, los diseñadores decidieron que necesitaban un manual de instrucciones muy mejorado y
dedicaron varios meses más a perfeccionar un manual tutorial con muchos ejemplos e ilustraciones.
Una segunda prueba encontró que algunas secretarias podían usar el dispositivo, pero la mayoría
aún estaba desconcertada. Los diseñadores estaban muy descontentos y cuestionaron
cuidadosamente a las pocas secretarias exitosas. Resultó que todas las secretarias que pudieron
usar el dispositivo tenían experiencia previa con la programación de computadoras. Ahora el problema
estaba claro. Los diseñadores, siendo ellos mismos programadores de computadoras, habían creado
un sistema que era óptimo para cualquiera que pudiera pensar como un programador de
computadoras. Pero el usuario típico carecía de conocimientos informáticos. Por lo tanto, los
diseñadores crearon un lenguaje nuevo e ineficiente que requería muchas más instrucciones para
completar cualquier programa de grabación dado. Pero este nuevo lenguaje era fácil de aprender y
fácil de usar. Una prueba final mostró que la gran mayoría de las secretarias ahora podían cumplir
con la tarea. El entrenamiento del diseñador, que había enfatizado la eficiencia en minimizar la
duración de un programa, los había engañado para que violaran el primer mandamiento. Habían
diseñado para ellos mismos y no para el usuario. Pero se evitó el desastre porque los diseñadores
fueron lo suficientemente inteligentes como para probar su producto antes de enviarlo por la puerta.
Entonces, un aspecto importante de honrar al usuario es probar usando la misma población que eventualm
El último ejemplo de una violación a discutir es el diseño de un torno (Figura 15.1).
Aquí, la población de usuarios es conocida. Pero, como muestra la figura 15.1, los controles del torno
fueron diseñados para un ser humano con un tronco muy corto y brazos extremadamente largos.
Ningún ser humano tiene estas dimensiones corporales. Este ejemplo demuestra que es más fácil
cambiar la máquina que cambiar a la persona que debe operarla.
El valor de la vida
Un tema importante, pero a menudo descuidado, en los factores humanos es el valor de la vida. Puede
parecer una tontería asignar un valor económico a la muerte, pero esto se hace todo el tiempo cuando
los fabricantes deciden cuánto equipo de seguridad se debe incorporar en los sistemas y qué tipo de
advertencias de seguridad se necesitan. Ningún producto es perfectamente seguro. Incluso un botón
pequeño podría resultar fatal si se lo traga un bebé.
Un discurso presidencial a la Sociedad de Factores Humanos (Parsons, 1970) discutió la vida y la
muerte. El valor de una vida humana se ha evaluado de muchas maneras, desde unos pocos centavos
correspondientes al valor de los productos químicos que componen el cuerpo humano hasta pólizas de
seguros de millones de dólares sobre la vida de ejecutivos corporativos. Parsons estimó que elegir
devolver a los astronautas del Apolo a la Tierra, en lugar de permitirles morir en el espacio, le costó a los
contribuyentes estadounidenses alrededor de 500 millones de dólares por astronauta. Aunque Parsons
no abogaba por una misión Apolo kamikaze, está claro que no todas las vidas se valoran por igual.
Los psicólogos de factores humanos estudian una amplia Aunque no están del todo ausentes, las variables de control
gama de temas. Como resultado, se estudia una amplia son mínimas en gran parte de la investigación aplicada.
variedad de variables independientes. Un investigador Los entornos de campo en los que se lleva a cabo la mayor
interesado en el papel de las ilusiones visuales en los parte de esta investigación impiden el tipo de control
accidentes aéreos estudiaría las mismas variables experimental que exigiríamos dentro del laboratorio.
independientes que un psicólogo experimental interesado en Por esta razón, los investigadores deben estar atentos a la
la percepción. De manera similar, un investigador interesado hora de identificar posibles variables de confusión que podrían
en la capacitación manipularía algunas de las mismas proporcionar explicaciones contrapuestas de los resultados
variables independientes, por ejemplo, la práctica, la experimentales. Alternativamente, cuando se permite que
distribución de la práctica y la modalidad de presentación, varíen variables extrañas relevantes, pueden oscurecer los
como un investigador de la memoria. Un científico de factores efectos reales del tratamiento.
humanos que estudie la carga de trabajo mental
esta pregunta se denomina años de vida ajustados por calidad (AVAC). Se calcula en tres
pasos (Thompson, Graham, & Zellner, 2001). Para ilustrar esto, suponga algún nuevo
dispositivo de seguridad para vehículos que evitará 1000 muertes y 50 000 lesiones a largo plazo p
1. Calcule el número de años de vida conservados por el dispositivo. Si la muerte promedio reduce la
esperanza de vida en 40 años y la lesión promedio reduce la esperanza de vida en 0,5 años, la
ganancia total es de 65 000 años de vida (1 000 × 40 más 50 000 × 0,5).
2. Ajuste por la calidad de los años de vida ahorrados. Si el nuevo dispositivo no permite que las
personas funcionen con la máxima calidad (1,0), sino que solo permite una calidad de 0,9, entonces,
en lugar de 40 000 AVAC, solo hay 36 000 AVAC (1000 × 40 × 0,9).
3. Dar cuenta de la calidad de vida de los sobrevivientes con lesiones. Suponga que el dispositivo
mejora la calidad de vida promedio de 0,6 (accidente sin dispositivo) a 0,9. Luego, 50 000
supervivientes obtendrán 0,3 AVAC por año durante el resto de sus vidas. Asumiendo en promedio
que esto es 40 años, esto produce 600,000 AVAC adicionales.
ÿ FIGURA 15.2
Landolt C's.
En su estudio, solo se utilizaron dos observadores masculinos en todas las condiciones experimentales.
Ambos observadores tenían una agudeza estática de 20/20 cuando usaban anteojos, los cuales, por supuesto,
se usaron durante el experimento. Aunque se trata de un pequeño número de sujetos, cada observador participó
en más de cuarenta sesiones de 40 a 60 minutos durante un período de 12 meses. Los diseños de n pequeña
no se utilizan para minimizar el esfuerzo experimental.
En cambio, son apropiados en situaciones experimentales altamente controladas donde los datos se pueden
replicar fácilmente.
El experimento
Los objetivos de Landolt C se proyectaron en una pantalla blanca. La longitud de onda o el color era una variable
independiente, con objetivos individuales presentados en una de cuatro longitudes de onda: blanco, azul,
amarillo o rojo. La brecha en los objetivos tenía cuatro ubicaciones posibles: arriba a la izquierda, arriba a la
derecha, abajo a la izquierda, abajo a la derecha. La posición de la brecha varió aleatoriamente de un ensayo a
otro. El observador, para estar en lo correcto, tenía que informar la posición de la brecha.
La figura 15.2 muestra una muestra de los tamaños de los espacios utilizados en el experimento. El método de
los límites, una técnica psicofísica (véase el capítulo 6), se utilizó para determinar el umbral o el tamaño del
espacio que era demasiado pequeño para permitir que los sujetos identificaran correctamente la posición del
espacio. El tamaño de la brecha, entonces, era una segunda variable independiente. Una ejecución de prueba
siempre comenzaba con una gran brecha objetivo. Después de una respuesta correcta, se redujo el tamaño de la bre
Esto continuó hasta que se dio una respuesta incorrecta. Luego se aumentó el tamaño del espacio hasta el del
ensayo anterior y se repitió el procedimiento. Cuando el observador cometió un error por segunda vez con un
tamaño de espacio dado, se detuvo la prueba en esas condiciones.
El umbral se registró como la siguiente brecha de mayor tamaño.
Long y Garvey (1988) examinaron los datos de los dos observadores por separado, porque la
investigación de n pequeña generalmente no promedia los datos de diferentes observadores. Descubrieron
que a medida que aumentaba la velocidad del objetivo, también aumentaba el umbral (tamaño de la brecha).
Los objetivos que se movían más rápido eran más difíciles de percibir. Los objetivos azules eran más fáciles
de percibir (tenían un umbral más bajo) que los objetivos presentados en blanco, amarillo o rojo en la
condición de visualización nocturna (visión escotópica), pero no en la condición de visualización diurna (visión f
Estos resultados tienen algunas implicaciones prácticas interesantes. Por ejemplo, la iluminación roja
se usa habitualmente para mantener la adaptación humana a la oscuridad (es decir, para mantener los ojos
de una persona acostumbrados a ver en la oscuridad). La investigación de Long y Garvey sugiere que la
iluminación azul (en lugar de la roja) permitiría a las personas detectar y reconocer más fácilmente objetivos
en movimiento en condiciones de observación nocturna.
El vuelo 401 de Eastern Airlines se acercaba al Aeropuerto Internacional de Miami cuando el piloto se dio
cuenta de que la luz indicadora de la rueda de morro no estaba iluminada. Por lo tanto, se desvió y voló
sobre los Everglades a baja altura mientras la tripulación intentaba determinar si el problema era la luz de
señal o si el tren de proa no estaba bajado y bloqueado en su posición de aterrizaje. Aunque aterrizar un
avión con una rueda de morro averiada no es un procedimiento muy peligroso, la tripulación naturalmente
quería bajar la rueda manualmente si la luz de señal mostraba correctamente una falla en el tren de morro.
El avión volaba con piloto automático mientras toda la tripulación de tres hombres intentaba determinar
si la bombilla estaba defectuosa y si el tren no funcionaba. Sin embargo, sin que la tripulación lo supiera, el
piloto automático se había desconectado accidentalmente y el avión había comenzado un descenso gradual.
La atención de la tripulación se centró en la luz de señal; Pasó bastante tiempo antes de que un copiloto
notara la lectura del altímetro. En los 8 segundos restantes antes de que el vuelo 401 se estrellara contra el
suelo, la tripulación no intentó aumentar la altitud. La causa mecánica de este accidente que mató a 99
personas fue una bombilla quemada. La causa psicológica fue el proceso mental de atención. La tripulación
estaba tan concentrada mentalmente en resolver el problema de la señal luminosa que nadie prestó atención
al problema más importante de volar el avión y controlar la altitud.
El experimento
Se utilizó una tarea de elección-reacción para evaluar a los pilotos en escenarios de vuelo simulados. Los
objetivos principales del experimento eran (1) descubrir si una tarea secundaria de elección-reacción
podía cumplir con el supuesto de no interferencia con la tarea primaria de vuelo; y, si pudiera, (2) para
ver si era una variable dependiente adecuada para medir la carga de trabajo mental del piloto. No todos
los resultados se discuten aquí; el lector interesado debe ver el informe publicado por Kantowitz, Hart y
Bortolussi (1983).
La tarea secundaria consistía en dos o cuatro tonos auditivos. (Las razones para usar tareas de
dos y cuatro opciones están relacionadas con cuestiones teóricas que van más allá del alcance de este
capítulo; consulte Kantowitz & Knight, 1976). Los pilotos respondían a los tonos presionando un interruptor,
montado debajo del pulgar izquierdo del piloto. en la dirección apropiada, dependiendo del tono del tono.
Los tonos ocurrieron cada 22 segundos durante el vuelo simulado.
Cada piloto voló un escenario de vuelo difícil y uno fácil, con una duración de 22 minutos cada uno.
Los escenarios se construyeron con base en datos de calificación anteriores (Childress, Hart y Bortolussi,
1982). Cada escenario se voló tres veces: una vez solo como condición de control, una vez con una tarea
secundaria de dos opciones y una vez con una tarea secundaria de cuatro opciones.
La figura 15.3 muestra el error en la tarea de vuelo en función del nivel de la tarea secundaria. El
escenario de vuelo duro mostró mayor error, como se esperaba; esto confirmó las predicciones basadas
en los datos de calificación utilizados para construir los escenarios de vuelo. De mayor importancia es el
efecto de la tarea secundaria. Un análisis estadístico apropiado muestra que las dos curvas de la figura
15.3 son planas. No hay diferencia estadística entre ninguna tarea secundaria (etiquetada como "ninguna"
en la figura) y secundaria de dos o cuatro opciones.
40
Tareas. Por lo tanto, se validó la suposición clave de que los pilotos primero vuelan el avión y no dejan
que las tareas secundarias interfieran con la tarea principal de vuelo.
La figura 15.4 muestra el desempeño en la tarea de tono secundario en función del segmento de
vuelo. El eje vertical muestra la información transmitida en bits por segundo. Esta es una medida que
tiene en cuenta tanto la velocidad como la precisión de la respuesta. Las puntuaciones más altas
indican un mejor desempeño. Existen diferencias estadísticas fiables entre estos puntos. En particular,
los últimos segmentos de vuelo mostraron las puntuaciones más bajas. Esto significa que la atención y
la carga de trabajo fueron mayores durante este segmento. Se prestó relativamente menos atención a
la tarea secundaria durante este segmento, por lo que la puntuación de bits por segundo es baja. Este
resultado tiene un sentido intuitivo para los pilotos, quienes creen que la carga de trabajo es mayor
durante el aterrizaje. Sin embargo, su opinión es subjetiva. Los resultados objetivos de la figura 15.4 no
se basan en opiniones.
ÿ FIGURA 15.4
1.50
Información transmitida sobre la tarea
secundaria en función del segmento de
1.25
vuelo.
1.00
0.75
segundo
medios
Bits
por
0.50
0.25
1 2 3 45
comienzo Aterrizaje
Segmento de vuelo
NASA
©
ÿ FIGURA 15.5
frecuencia cardíaca (72 a 87 latidos por minuto) para el piloto; no se obtuvo tal aumento para el copiloto. Sin embargo, las estimaciones
subjetivas de la carga de trabajo, aunque difirieron significativamente entre segmentos de vuelo, no difirieron entre pilotos y copilotos.
Como ocurre con la mayoría de los estudios de carga de trabajo en vuelo, estos resultados no son tan fáciles de interpretar
como los estudios de laboratorio o de simulador. La frecuencia cardíaca es muy sensible a la cantidad de esfuerzo físico: la frecuencia
cardíaca más alta para los pilotos podría reflejar la actividad física más que la actividad mental. La variación de la frecuencia cardíaca
es una medida de la carga de trabajo mental que se ve menos afectada por el esfuerzo físico, pero los investigadores no informaron
los resultados de la variación. El mejor enfoque parece ser una combinación de medidas objetivas, subjetivas y fisiológicas realizadas
en laboratorios y simuladores. Las medidas objetivas se pueden utilizar para calibrar los otros tipos de medidas que son más
apropiadas para las pruebas en vuelo. El progreso futuro en la medición de la carga de trabajo mental del piloto depende de la
vinculación de los resultados actuales con las teorías de la atención. Esta no es una tarea fácil y requerirá una mejor cooperación
Los métodos utilizados para medir la carga de trabajo mental del piloto se han aplicado con éxito para medir la carga de trabajo de
los conductores de camiones profesionales. Recuerde que la suposición principal para medir la carga de trabajo es que la inserción
de la tarea secundaria no altera el desempeño del operador en la tarea principal (Figura 15.6). Aunque esta suposición suele ser
cierta para los pilotos profesionales que requieren una gran cantidad de capacitación especializada antes de poder obtener y mantener
una licencia de piloto (Kantowitz y Casper, 1988), no hay garantía de que esta suposición se cumpla para los conductores de camiones.
Kantowitz (1995) probó esta suposición en un simulador de manejo utilizando conductores que tenían licencias de conducir
0.2 0.2
0.1 0.1
0.0 0.0
Posición
media
carril
de
-0.1 -0.1
-0.2 -0.2
-0.3 -0.3
-0.4 -0.4
-0.5 -0.5
Luz Pesado Luz
Tarea de tacómetro
4.00
Curvas
3.95 Difícil
Fácil
3.90
3.85
3.80
respuesta
Tiempo
medio
de
3.75
3.70
3.65
3.60
3.55
3.50
Pesado Luz
Densidad de tráfico
ÿ FIGURA 15.7
Tiempo de respuesta (segundos) y densidad de tráfico para la tarea secundaria del tacómetro.
76
inmediato
Correcto)
Recuerdo
(%
75
74
73
72
71
70
Pesado Luz
Densidad de tráfico
La metodología de tarea dual es ideal para evaluar el uso de teléfonos móviles con manos libres, aunque
es necesario incluir las condiciones de control de tarea única adecuadas (Kantowitz & Simsek, 2000). ¿La carga
cognitiva impuesta por la conversación en un teléfono celular (tarea secundaria) interfiere con el desempeño de
la tarea principal (conducir)?
Un estudio reciente (Strayer & Johnston, 2001) utilizó una tarea de conducción simulada primitiva para
responder a esta pregunta. Esta tarea, llamada seguimiento de persecución, requiere que las personas usen un
joystick para controlar un cursor en una pantalla de computadora que debe seguir (o rastrear) un objetivo en
movimiento. Ocasionalmente, el objetivo parpadeaba en rojo o verde y los participantes tenían que presionar un
botón en el joystick para responder al destello rojo; por lo tanto, se utilizó una reacción de Donders C como tarea
secundaria. Luego, los autores agregaron lo que llamaron una condición de doble tarea en la que los participantes
escuchaban la radio o entablaban conversaciones en un teléfono portátil o manos libres. En realidad, esta era
realmente una condición de triple tarea, ya que los participantes tenían que realizar (1) seguimiento de
persecución, y (2) una reacción de Donders C, y (3) conversar o escuchar la radio.
El tiempo de reacción de Donders C fue elevado en las condiciones de teléfono (triple tarea) en relación
con la condición de seguimiento de persecución sin teléfono de doble tarea. Los resultados fueron los mismos
para las condiciones de teléfono de mano o de manos libres. El tiempo de reacción no fue elevado para la
condición de radio. Si bien estos resultados son consistentes con la hipótesis de que ningún tipo de teléfono
celular debe usarse mientras se conduce, existen varias limitaciones en el estudio.
Primero, los autores no demostraron que la tarea de seguimiento de persecución, aunque ampliamente
utilizada durante décadas en psicología experimental (Jagacinski y Flach, 2003), sea un sustituto válido de la
conducción real y no citaron ninguna investigación dirigida a este punto. En segundo lugar, los autores fueron
negligentes al no informar sobre el rendimiento en la tarea de seguimiento de persecución. Es posible que las
diferencias entre el uso de teléfonos portátiles y de manos libres se hayan reflejado en el seguimiento del
rendimiento. En tercer lugar, los autores no reconocieron que habían creado una tarea triple y que su condición
de referencia en sí misma era una condición de tarea dual. Por lo tanto, no se incluyeron en su experimento las
condiciones apropiadas de una sola tarea de seguimiento sin reacción C y reacción C sin seguimiento.
Este experimento fue ampliamente citado en los medios de comunicación como prueba de que los teléfonos
móviles con manos libres también deberían prohibirse. Si bien los autores de este texto están de acuerdo con
esa conclusión, el estudio de Strayer y Johnston (2001) por sí solo no es suficiente para justificar la legislación. Otro
Las variables dependientes, colisiones traseras y millas recorridas, se recopilaron durante un período de 1
año. Durante el curso del estudio, los taxistas acumularon más de 60 millones de millas bajo una variedad de
condiciones climáticas y de la carretera.
Malone y Kirkpatrick encontraron que los conductores que usaban una luz de freno montada en alto y
centrada experimentaron significativamente menos colisiones traseras que los conductores en cualquier otra
condición de configuración. La figura 15.9 muestra el número de accidentes en los cuatro
Número de accidentes
250
para diferentes
configuraciones de luces de freno. 200
accidentes
Número
de
150
100
50
0
Control Apartado Doble alto alto centrado
Existente Función Montado Montado
condiciones experimentales. Como puede ver, los conductores en la condición de luz de freno montada
en alto y centrada tuvieron un 54 por ciento menos de accidentes que los conductores en la condición
de control (la configuración existente). Cuando ocurrieron accidentes, la luz de freno montada en alto
centrada redujo la extensión del daño en un 38 por ciento. Malone y Kirkpatrick especularon que esta
configuración de luces de freno resultó en una aplicación más rápida de los frenos en el siguiente
vehículo, lo que resultó en velocidades más lentas en el impacto y menos daño a ambos vehículos. ¿Qué
permitió que el siguiente vehículo frenara más rápido cuando el taxi estaba equipado con la luz de freno
central montada en alto? Malone y Kirkpatrick llegaron a la conclusión de que se acercaba más a la línea
de mirada normal de las personas, es decir, hacia donde las personas normalmente miran cuando
conducen. Este estudio ayudó a cambiar la configuración de las luces de freno en todos los automóviles
vendidos en los Estados Unidos. Ahora todos los autos nuevos deben tener la luz de freno centrada y montad
Desafortunadamente, investigaciones posteriores han demostrado que la luz de freno montada en
alto no ha resultado en una reducción cercana al 50 por ciento de los accidentes (Mortimer, 1993). El
beneficio real oscila entre el 22 y el 3,5 por ciento. Un estudio reciente basado en datos de accidentes
de reclamos de seguros encontró solo un beneficio del 5 por ciento (Farmer, 1995). No sabemos por qué
el beneficio fue mucho menor de lo previsto. Parte de la razón de este beneficio reducido puede ser la
novedad: a medida que más vehículos estaban equipados con luces de freno montadas en alto, los
conductores se acostumbraron más a ellas y, por lo tanto, las luces se volvieron menos efectivas. Sin
embargo, la investigación de factores humanos sobre estas luces de freno continúa documentando los
beneficios de una luz de freno central montada en alto (Theeuwes & Alferdinck, 1995).
Los factores humanos son un área apasionante y desafiante de la psicología. Muchos investigadores
se sienten atraídos por esta área debido a la oportunidad de aplicar los principios de la psicología
experimental a los problemas de la vida cotidiana. La investigación discutida en este capítulo refleja este
enfoque general. Por ejemplo, Long y Garvey (1988) aplicaron el método de límites desarrollado en
psicofísica para estudiar los efectos de la longitud de onda objetivo en la agudeza visual dinámica.
Malone y Kirkpatrick utilizaron principios básicos de percepción para probar la luz de freno montada en
alto y centrada. En última instancia, el éxito del psicólogo experimental, según lo evaluado por la sociedad
que apoya la investigación psicológica, está relacionado con qué tan bien su investigación aborda los
problemas que preocupan a la sociedad. Como ha visto en este capítulo, los psicólogos de factores
humanos han tenido éxito al abordar varios de estos problemas.
La investigación de campo casi siempre tiene limitaciones que impiden la aplicación directa de
métodos y soluciones de laboratorio. Aunque podemos medir la carga de trabajo mental en el
laboratorio y en simuladores de vuelo con cierto grado de éxito (ver Kantowitz & Campbell, 1996,
para una revisión), en la actualidad no existe una técnica en vuelo universalmente aceptada para
el monitoreo continuo de la mentalidad del piloto. carga de trabajo Este es el problema discutido
aquí.
Problema Encuentre una forma discreta de medir la carga de trabajo mental del piloto en vuelo.
La palabra clave aquí es discreta. Esto significa que nuestro método no puede interferir con los
procedimientos normales de vuelo. Por lo tanto, debe descartarse la mejor técnica de laboratorio,
utilizando una tarea secundaria objetiva. Bajo una gran carga de trabajo, la atención adicional
que podría desviarse a una tarea secundaria podría presentar un peligro para la seguridad. El
mismo argumento podría esgrimirse en contra de que los pilotos informen continuamente las
calificaciones subjetivas de la carga de trabajo.
Esto sugiere que una medida fisiológica podría ser la más adecuada como variable
dependiente. A los pilotos no les molestaría que se pudieran colocar electrodos indoloros para
registrar el ritmo cardíaco o las ondas cerebrales, por nombrar dos posibles medidas fisiológicas.
Las variables independientes podrían ser la fase del vuelo y piloto versus copiloto.
Hipótesis Las ondas cerebrales indican la carga de trabajo mental del piloto en vuelo.
Esta hipótesis es mucho más compleja de lo que parece al principio. El principal problema
experimental es cómo puntuar las ondas cerebrales. La tecnología para registrar ondas cerebrales
(llamadas potenciales evocados) de electrodos de superficie adheridos al cuero cabelludo sin
dolor está bien establecida, pero la interpretación de estas señales es otra cuestión. Hay muchos
componentes dentro del potencial evocado; Se necesitan sofisticados programas informáticos
para distinguir los componentes verdaderos del ruido eléctrico. Incluso después de que los
componentes se hayan identificado y puntuado correctamente, aún deben estar relacionados con
la carga de trabajo del piloto.
En aras de la discusión, supongamos que hemos sido capaces de localizar algunos
componente potencial evocado específico y tener un pequeño pero poderoso sistema informático
en el avión que puede procesar continuamente las ondas cerebrales del piloto y el copiloto. Nos
gustaría demostrar que la magnitud del componente de potencial evocado aumenta con el
aumento de la carga de trabajo del piloto. También podríamos predecir que el piloto exhibiría una
magnitud mayor que el copiloto.
Los detalles de nuestro diseño experimental probablemente dependerán de los requisitos de
vuelo de la misión. Los investigadores de campo por lo general no pueden darse el lujo de diseñar
misiones que se ajusten a sus necesidades de investigación. En su lugar, el problema de
investigación debe llevarse a cuestas a alguna misión existente. Esto limita mucho el diseño
experimental. Esperamos poder identificar diferentes fases de vuelo (aterrizaje, crucero, etc.) que
proporcionaron diferentes niveles de carga de trabajo del piloto. Por supuesto, tendríamos que
usar los resultados publicados de experimentos anteriores para relacionar la carga de trabajo y la
fase de vuelo.
ÿ RESUMEN
1. Los factores humanos es la disciplina que trata de optimizar la sistemas de trabajo. Por razones de seguridad y economía, la
relación entre las personas y la tecnología. investigación con simuladores se utiliza en áreas como la aviación y la
Muchos investigadores y profesionales de los factores humanos se energía nuclear.
formaron originalmente en psicología experimental. 5. Tanto las medidas objetivas como las subjetivas se utilizan para
Sin embargo, el alcance de los factores humanos incluye más que la estudiar la carga de trabajo mental. Las medidas subjetivas son
psicología experimental. más fáciles de obtener, mientras que las medidas objetivas son
2. El principio principal de los factores humanos es "Honra a tu más fáciles de verificar por los investigadores.
usuario". Dado que las personas son el elemento común en varios 6. Las teorías son tan importantes para guiar la investigación de
sistemas tecnológicos, no podemos mejorar el rendimiento y la factores humanos como lo son para guiar la investigación básica.
calidad del sistema sin comprender cómo funciona el ser humano Los modelos de la visión del color se han aplicado al estudio de
como parte del sistema. la agudeza visual dinámica. Los modelos de atención son útiles
3. En muchos escenarios de factores humanos, no se puede emplear la para dirigir los estudios de simulación de la carga de trabajo mental.
metodología de investigación tradicional de n grande de la investigación 7. Los psicólogos de factores humanos están cada vez más
psicológica. La agudeza visual dinámica es un tema de investigación en preocupados por la seguridad del tráfico. Esto se estudia en
factores humanos donde las técnicas de investigación psicofísicas son simuladores de conducción, en pistas de prueba y en carretera con tráf
las más apropiadas. El color y la velocidad del movimiento afectan la Los estudios con simulador son los más seguros y ofrecen un alto
agudeza visual dinámica. control experimental. Los estudios en carretera son más arriesgados y ofrecen
menos control pero son más realistas.
ÿ TÉRMINOS CLAVE
medidas objetivas
1. ¿Qué factores éticos debe tener un investigador de factores humanos? 5. Compare las ventajas y desventajas de estudiar la carga de trabajo
considerar al emprender una investigación que tiene el mental del piloto en un simulador de vuelo en lugar de en un avión
potencial de alterar los ambientes de trabajo de las personas? durante el vuelo.
2. ¿Cómo podría un diseñador de sistemas tener en cuenta las 6. El estudio revisado en el capítulo mostró que las luces de freno, que
características de seguridad que agregan costos al sistema pero se habían mantenido en un arreglo en los automóviles durante
que pueden proteger vidas humanas? años, se podían configurar de manera diferente para producir
3. Enumere algunas situaciones prácticas en las que el color del objeto automóviles más seguros. ¿Hay alguna manera de hacer lo mismo
podría ser un aspecto importante de la agudeza visual dinámica. con los faros, de modo que ayuden al conductor a ver mejor y sea
menos probable que cieguen a los conductores que se aproximan?
4. Discuta algunas de las dificultades inherentes al fuego de campo Sugiera algunas ideas que podrían probarse.
búsqueda. ¿Se te ocurren métodos para combatir estos
problemas?
CONEXIONES WEB
Un sitio interesante que cataloga los malos diseños de los objetos y el medio ambiente se puede encontrar en:
http://www.baddesigns.com
Una excelente descripción general de los factores humanos junto con numerosos enlaces está disponible en:
http://www.ergonomics.org.uk
También es interesante la web de la Human Factors and Ergonomics Society:
http://www.hfes.org
PSICOLOGÍA EN ACCIÓN
Muchos conductores, especialmente los de mayor edad, no entienden todas las señales de tráfico simbólicas de las
carreteras estadounidenses (Dewar, Kline y Swanson, 1994; Hanowski, Kantowitz y Kantowitz, 1996). Una vez que los
expertos en factores humanos puedan determinar qué señales son difíciles de comprender, estas señales se pueden
rediseñar y mejorar. Realice el siguiente cuestionario breve y descubra cuántas señales de tráfico comprende. Luego
muéstrele el cuestionario a un conductor anciano, tal vez un abuelo, y vea cómo les va. Compare sus resultados con las
respuestas dadas al final de esta sección. ÿ
1. 2. 3. 4.
8.
5. 6. 7.
10 11 12
9.
13 14 15. dieciséis.
17 18 19 20
3. Ruta de 86 76
7. Cruce de bicicletas 47 41
8. Anfiteatro 32 28
10. Biblioteca 62 43
Los ítems 1 a 10 son de Dewar et al. (1994). Los conductores más jóvenes tenían entre 18 y 39 años; los conductores mayores tenían más de 60 años. Elementos
11 a 20 son de Hanowski et al. (1996). Los conductores más jóvenes tenían entre 18 y 22 años; los conductores mayores tenían más de 65 años.
APÉNDICE A
EXPERIMENTAL
PSICOLOGÍA:
UN HISTÓRICO
BOSQUEJO
Gustav Fechner
wilhelm wundt
Hermann Ebbinghaus
ESCUELAS DE PSICOLOGÍA
Estructuralismo: la estructura de la vida mental
Especialización
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
(HERMANN EBBINGHAUS)
La curiosidad y el asombro son las principales motivaciones de la ciencia, y hay pocos temas
que la gente haya encontrado más interesantes que el funcionamiento de sus propias mentes.
Muchos de los escritos de los grandes filósofos, desde la época de Aristóteles hasta el presente, se
han ocupado de lo que puede llamarse problemas psicológicos. ¿Cómo percibimos y conocemos el
mundo exterior? ¿Cómo aprendemos al respecto y recordamos lo que aprendemos? ¿Cómo usamos
esta información para construir conceptos del mundo y resolver los problemas que el mundo nos
presenta? ¿Cuáles son las raíces del comportamiento anormal? ¿Existen leyes que rigen el
comportamiento social y político? ¿Hay significado para los sueños?
Aunque estos temas se han discutido durante siglos, los métodos de la ciencia no se aplicaron
al estudio de la mente y el comportamiento humanos hasta trescientos o cuatrocientos años después
de encontrar un lugar sólido en la física (así la cita de Ebbinghaus).
De hecho, la psicología de hoy debe compararse, tal vez, con la física del siglo XVI.
Como muchos estudiantes de psicología se dan cuenta (para su consternación), todavía tenemos
mucho que aprender sobre muchas áreas importantes del comportamiento humano. Este apéndice
proporciona un bosquejo breve y muy tosco de la historia intelectual de la psicología experimental.
Se pueden encontrar historias completas en Boring (1950), el clásico en el campo, y en un trabajo
más reciente y fácil de leer de Schultz y Schultz (1987) (ver también Pickren & Dewsbury, 2002;
Rieber & Salzinger, 1998).
Supongamos que la mente es, como decimos, un papel blanco, vacío de todo carácter, sin
ninguna idea: ¿Cómo llega a estar amueblada? ¿De dónde viene esa vasta reserva que la
atareada e ilimitada fantasía del hombre ha pintado en ella con una variedad casi infinita?
¿De dónde tiene todos los materiales de la razón y del conocimiento? A esto respondo, en
una palabra, desde la EXPERIENCIA. En eso se funda todo nuestro conocimiento.
(1690/1959, Libro II, Cap. 1)
Los filósofos estaban preparando el camino para una psicología científica al tratar la
mente como sujeta a leyes naturales, pero su método de estudio era simplemente anécdota y
reflexión. No importa lo brillantes que fueran las ideas, estos métodos probablemente harían
avanzar nuestro conocimiento un poco más allá de las cuidadosas reflexiones de Platón y
Aristóteles siglos antes. Lo que se necesitaba era la aplicación de los métodos experimentales
y la lógica de la ciencia al estudio de la mente y el comportamiento. Como observó Boring, “La
aplicación del método experimental al problema de la mente es el gran evento sobresaliente al
que ningún otro es comparable”. Este método llegó a la psicología a través de la fisiología.
Los fisiólogos alemanes de mediados del siglo XIX estaban interesados en lo que hoy se
considera fisiología sensorial: la fisiología de los órganos de los sentidos (ojos, oídos, etc.) y
la transmisión de información desde estos órganos al cerebro a través del sistema nervioso.
sistema. Muchos de los fisiólogos alemanes esperaban que la fisiología pudiera reducirse
finalmente a la física y, a medida que se interesaron en la fisiología del sistema nervioso
humano, se acercaron cada vez más a tratar la mente como una máquina física. La Sociedad
de Física de Berlín se formó en la década de 1840 con un compromiso primordial con la
creencia de que, en última instancia, todos los fenómenos podrían explicarse en términos de
física. Cuatro de los jóvenes científicos radicales de la sociedad, todos veinteañeros, firmaron
con sangre (así cuenta la historia) un
La contribución de Helmholtz
Uno de estos jóvenes científicos fue Hermann von Helmholtz (1821–1894). Era principalmente físico y
fisiólogo y no estaba interesado en establecer la psicología como una disciplina independiente, pero se le
da mucho crédito a su investigación por haber tenido este efecto.
Su trabajo sobre la visión y la audición fue abrumadoramente importante, pero lo que debemos enfatizar
aquí es su papel en la conducción de lo que puede considerarse como experimentos de transición entre la
fisiología y la psicología experimental.
Un caso famoso fue su uso de lo que ahora se conoce como un experimento de tiempo de reacción.
para estudiar la velocidad de los impulsos neurales. Johannes Müller, un famoso fisiólogo alemán, había
argumentado que la transmisión de los impulsos nerviosos era instantánea, o quizás se acercaba a la
velocidad de la luz. Si se pellizca la mano, ¿observa que transcurre algún tiempo entre el momento en que
se ve pellizcando y el momento en que siente el pellizco?
Probablemente no. De todos modos, Müller también afirmó que probablemente nunca podríamos calcular la
velocidad de los impulsos nerviosos. Solo unos años más tarde (en 1851), Helmholtz midió la velocidad de
forma experimental. La idea básica era ingeniosamente simple: estimular un nervio a dos distancias
diferentes del cerebro y medir la diferencia de tiempo que tarda el organismo en responder a la estimulación.
Si se conoce la distancia entre los dos puntos de estimulación y la diferencia en el tiempo necesario para
responder, entonces se puede calcular la tasa del impulso nervioso, ya que la tasa es igual a la distancia
dividida por el tiempo. Helmholtz estimuló a personas con los ojos vendados en el hombro o en el tobillo y
midió qué tan rápido podían reaccionar con la mano (empujando una palanca) en cada caso. Dado que
podía medir aproximadamente cuánto más lejos tendría que viajar el impulso al cerebro desde el tobillo que
desde el hombro, pudo estimar la velocidad de los impulsos nerviosos a la velocidad relativamente lenta de
50 metros por segundo, ni siquiera la velocidad del sonido, mucho menos el de la luz! El trabajo experimental
más cuidadoso de Helmholtz sobre este tema fue con ranas (donde, por supuesto, la técnica, pero no la
lógica, era diferente), y las estimaciones no eran demasiado diferentes. De hecho, las estimaciones han
resistido más o menos la prueba del tiempo, aunque hoy sabemos que la velocidad del impulso nervioso
depende del diámetro de los nervios implicados.
Una nota al pie interesante es que Helmholtz estaba tan desesperado por la gran variabilidad (o
diferencias) en los tiempos de reacción que encontró entre los sujetos, e incluso dentro del mismo sujeto en
diferentes ensayos, que abandonó por completo esta línea de investigación (Schultz & Schultz , 1987).
Muchos psicólogos desde Helmholtz también han lamentado la variabilidad que se encuentra en la
investigación psicológica, aunque la mayoría no la ha abandonado por este motivo. Gran parte de este libro
se ocupa del problema de la variabilidad en las medidas del comportamiento animal o humano y de cómo
superar este problema.
La psicología científi ca tuvo su nacimiento y vida temprana en Alemania. En esta sección, mencionamos
las contribuciones de cuatro de los primeros pioneros: Weber, Fechner, Wundt y Ebbinghaus.
La Tabla A.1 resume sus contribuciones y las de Helmholtz.
psicofísica
wilhelm wundt 1832-1920 Estableció el primer laboratorio de experimentación
psicología en 1879
Hermann Ebbinghaus 1850-1909 Escribió Memory en 1885, mostrando que se podían estudiar
fenómenos mentales complejos.
ernesto weber
Ernst Weber (1795–1878) fue un anatomista y fisiólogo de Leipzig cuya investigación se centró
en la sensación cutánea o el sentido del tacto. Su contribución más importante a la psicología
surgió de algunos experimentos que realizó para investigar si la participación activa de los
músculos afectaba el juicio de los pesos de los objetos (ver Capítulo 6). Hizo que la gente
comparara dos pesos, uno de los cuales se llamaba estándar. En un caso, los sujetos con los
ojos vendados tomaron primero un peso estándar y luego un peso de comparación e indicaron
al experimentador si los dos pesaban la misma cantidad. En otro caso, los sujetos eran pasivos;
simplemente tenían los pesos colocados en sus manos sucesivamente, y luego tomaban sus
decisiones.
Weber descubrió que los juicios eran más precisos cuando los sujetos activaban activamente
sus músculos; pero lo que es más importante, notó algo interesante en las habilidades de los
sujetos para detectar una diferencia entre los pesos estándar y de comparación. Cuanto mayor
sea el peso del estándar, mayor será la diferencia entre el peso estándar y el de comparación
antes de que los sujetos puedan notar la diferencia. Cuando el peso estándar era pequeño, solo
era necesaria una pequeña diferencia entre el estándar y la comparación para que los sujetos
detectaran una diferencia. Pero cuando el peso era grande, la diferencia necesaria para la
detección (llamada diferencia apenas perceptible, o jnd) era correspondientemente mayor.
Weber descubrió además que para cualquiera de los sentidos, la relación entre la cantidad de
diferencia necesaria para producir un jnd y el estándar era una constante. Así, no sólo la cantidad
de diferencia necesaria para producir un jnd aumenta con el tamaño del estándar, sino que lo
hace de una forma bastante sistemática. Este hecho se conoce como la ley de Weber (véase el
capítulo 6).
Gustav Fechner
Weber pensó que su hallazgo era una generalización interesante y útil, pero su importancia no lo
asombró de ninguna manera. Gustav Fechner (1801-1887) lo fue. Fechner fue excéntrico en
muchos sentidos, pero su importancia para la psicología fue grande. Se formó como físico, pero
también contribuyó a la filosofía, la religión, la estética y la psicología.
Entre muchas otras empresas académicas, escribió un libro sobre la vida después de la muerte y
Empezó a buscar leyes que relacionaran la intensidad de los estímulos físicos con la impresión subjetiva de
estos estímulos. Mientras lidiaba con este problema, se encontró con el trabajo de Weber y celebró
enormemente el principio que Weber descubrió, llamándolo ley de Weber. Fechner lo elaboró un poco; como
analizamos en el capítulo 6, esta extensión se denomina ley de Fechner. Para Fechner, esto fue el cumplimiento
de su esperanza de que existan relaciones cuantitativas exactas entre los mundos físico y mental. Así, decimos
que Fechner fundó la importante disciplina de la psicofísica, que consideramos en el Capítulo 6.
wilhelm wundt
Quizá la primera persona que se consideró principalmente un psicólogo, aunque al final de su carrera, fue
Wilhelm Wundt (1832-1920). Formado en fisiología y medicina (por Helmholtz, entre otros), se fue interesando
paulatinamente por la psicología. En 1874 se publicó su Principios de psicología fisiológica ; el eminente
historiador Boring lo llamó el libro más importante en la historia de la psicología experimental.
En él, Wundt revisó sistemáticamente todo lo que se sabía sobre psicología en ese momento y también
presentó su sistema de psicología. El libro pasó por seis ediciones y ayudó a sentar las bases para una
psicología sistemática. Las contribuciones de Wundt consistieron principalmente en organizar la psicología y
ayudar a establecerla como una disciplina independiente, más que en realizar importantes descubrimientos
científicos. Wundt capacitó a muchas personas que luego harían importantes contribuciones por derecho
propio. También se le da crédito por establecer el primer laboratorio de psicología experimental en 1879 en
Leipzig y por establecer la primera revista de psicología.
Aunque Wundt jugó un papel decisivo en el establecimiento de la psicología experimental como una
disciplina separada, no creía que los procesos mentales superiores como la memoria, el pensamiento y la
creatividad pudieran estudiarse experimentalmente. El método experimental, afirmó, sólo podía aplicarse al
estudio de la sensación y la percepción. Pensó que los procesos mentales superiores deberían estudiarse
mediante el examen de los trabajos de la civilización a lo largo de los siglos en varias culturas o mediante la
historia cultural o la antropología cultural. Wundt contribuyó con diez volúmenes de investigación a esta última
búsqueda.
Hermann Ebbinghaus
En el mismo año (1879) en que Wundt estaba estableciendo su laboratorio, se estaba trabajando para
desacreditar su creencia acerca de los límites extremos del método experimental en psicología. En este año,
Hermann Ebbinghaus (1850-1909) inició sus experimentos pioneros sobre el aprendizaje y la memoria
humanos, que culminaron en su importante libro,
ÿ FACULTADES DE PSICOLOGÍA
Es costumbre dividir la psicología en varias escuelas cuando se consideran los años 1890-1940 más
o menos, aunque esto daña ciertas tendencias en psicología que se resisten a encajar perfectamente
en estos casilleros. No obstante, describiremos brevemente aquí algunas de las principales
características de las escuelas del estructuralismo, el funcionalismo, el conductismo y la psicología
de la Gestalt.
Muchos libros de texto de psicología conectan a Wundt con la escuela de psicología estructural,
pero las ideas atribuidas a la psicología estructural están más estrechamente ligadas a Edward
Bradford Titchener (1867-1927). Titchener, uno de los estudiantes de Wundt, trajo este punto de
vista a los Estados Unidos y lo adelantó desde su laboratorio en la Universidad de Cornell. Aunque
estos hombres diferían en algunos detalles, podemos tratar sus puntos de vista juntos.
Como su nombre lo indica, la psicología estructural, o estructuralismo, se preocupaba
principalmente por descubrir la estructura de la mente. Según los estructuralistas, las tres cuestiones
principales de la psicología eran las siguientes: (1) ¿Cuáles son los elementos de la experiencia? (2)
¿Cómo se combinan? y (3) ¿Por qué? ¿Cual es la causa? Se consideraba que los elementos
básicos de la experiencia eran las sensaciones: imágenes, sonidos, sabores, olores, etc. Los otros
dos elementos de la experiencia eran imágenes o ideas, que representaban experiencias que no
estaban realmente presentes, y afectos, que eran reacciones emocionales, como el odio, la alegría
y el amor. Cada elemento de la experiencia también podría evaluarse por sus atributos de duración,
intensidad, calidad y claridad.
El trabajo de la psicología estructural fue descomponer las experiencias mentales complejas
en sus componentes con la creencia de que al comprender los elementos fundamentales de la
experiencia consciente, uno podría comprender cómo se combinan en fenómenos mentales
complejos. Así, era elementalista, ya que buscaba los elementos básicos de la experiencia mental.
Se pensaba que las sensaciones e imágenes elementales se componían a través de principios de
asociación para convertirse en eventos mentales complejos. El método de descomposición de estos
eventos mentales fue la introspección. Para los psicólogos estructurales, la introspección no se
refería a la reflexión casual, ni siquiera a la reflexión crítica, sino más bien a un método técnico
específico de ver la experiencia. Para los observadores ingenuos (es decir, todos nosotros), la
conciencia parece ser una sola pieza, o una corriente, como la describió William-James. Los
introspeccionistas entrenados fueron destetados de este punto de vista. Debían informar los
contenidos conscientes de una experiencia, en lugar del objeto focal bajo consideración.
Un introspectivo capacitado no informaría haber visto una mesa en el entorno, sino que informaría
haber visto un patrón espacial, un color, un brillo, etc., en particular. En otras palabras, los
introspeccionistas fueron entrenados para ver los elementos de la experiencia de ver una mesa. Si
uno informaba ingenuamente que había visto una tabla, se consideraba que se estaba cometiendo
el error de estímulo.
La escuela funcionalista era más vaga y amorfa que el pequeño y compacto grupo de
estructuralistas de Titchener. Los funcionalistas tenían poco uso para la introspección, pensaban
que era imposible estudiar los procesos mentales desprovistos de su contexto y función, y eran
mucho más propensos a respaldar programas prácticos o aplicados en psicología. Sin embargo,
los funcionalistas no tenían un programa específico para la psicología, como Titchener, y lo más
cerca que estuvieron de proporcionar un manifiesto fue el discurso presidencial de Angell ante
la Asociación Americana de Psicología (1907). Además de enfatizar las actividades aplicadas,
como las pruebas mentales y la educación (el campo al que emigró Dewey), el funcionalismo
ayudó a introducir el estudio de los organismos inferiores en la psicología. Esto se derivó
naturalmente de su énfasis en la evolución y la función de desarrollo de los procesos psicológicos.
En 1913, John Watson publicó un artículo llamado "La psicología como la ve el conductista". Así
comenzó la revolución conductista en psicología. Las ideas de Watson sobre lo que luego se
llamaría conductismo habían comenzado a tomar forma durante sus días en la Universidad de
Chicago, pero no se desarrollaron por completo hasta algunos años después, cuando enseñaba
en la Universidad Johns Hopkins. En su artículo de 1913, Watson atacó duramente la psicología
estructural y la introspección, con su énfasis en la conciencia y los contenidos mentales. Watson
argumentó que deberíamos barrer todas estas tonterías, que ni siquiera se pueden reproducir de
un laboratorio a otro, y estudiar algo en lo que todas las personas razonables podrían estar de
acuerdo: el comportamiento. Respaldó una declaración de Pillsbury de que “la psicología es la
ciencia del comportamiento” y continuó:
Creo que podemos escribir una psicología, definirla como Pillsbury, y nunca volver atrás en
nuestra definición: nunca usar los términos conciencia, estados mentales, mente, contenido,
introspectivamente, verificable, imágenes y similares. Puede hacerse en términos de estímulo y
respuesta, en términos de formación de hábitos, integración de hábitos y similares. Además,
creo que realmente vale la pena hacer este intento ahora. (1913, págs. 166-167)
La declaración clara y concisa de Watson sobre la posición del conductismo fue muy influyente.
Para muchos psicólogos, justificaba desechar muchas de las turbias tonterías que habían ocupado
el campo durante tanto tiempo. El gusto de Watson por escribir de forma directa e interesante
también fue evidente en sus otros trabajos, entre los que se encuentra su notable libro Psychology
from the Standpoint of a Behaviorist (1919).
Los conductistas tenían la intención de establecer la psicología como una ciencia natural, un
estatus del que pensaban que carecía en 1913. Su tema principal era el comportamiento. No había
necesidad de involucrarse en argumentos complicados sobre términos tales como conciencia,
pensamiento sin imágenes y apercepción, cuyos significados no estaban claros. Watson y los otros
conductistas atacaron tanto el estructuralismo como el funcionalismo por motivos de vaguedad.
Los conductistas no dijeron que la conciencia, la imaginería, etc., no existieran; simplemente
sostuvieron que tales términos no eran construcciones científicas útiles.
Los conductistas creían que los comportamientos más importantes se aprendían, por lo que
el estudio del aprendizaje se convirtió en el foco central de interés. Los estudios pioneros de Pavlov
y Thorndike, revisados en los capítulos 9 y 11, indicaron la posibilidad de una psicología objetiva
del aprendizaje, y desde entonces el enfoque de la psicología del comportamiento ha sido el
aprendizaje.
Los temas del conductismo provocaron una revolución dentro de la psicología, una revolución
que todavía está con nosotros. Gran parte del punto de vista conductista ya ha sido absorbido por
la corriente principal de la psicología, aunque siguen existiendo debates sobre muchos detalles.
De hecho, no existe una posición que hoy pueda llamarse conductismo, excepto la general que
respalda el estudio de la conducta como el tema apropiado de la psicología. (Presumiblemente,
todos los psicólogos experimentales se suscriben a este punto de vista hoy en día, ya que todos
están observando el comportamiento.) Más bien, hay una serie de diferentes
Es popular decir en estos días que el conductismo está en declive. Las construcciones mentales
(como la atención) se han reintroducido en la psicología, incluso en el estudio del comportamiento
animal. Pero estas construcciones mentales están estrechamente ligadas a las respuestas
observables. (Discutimos en los capítulos 7 y 14 cómo encontrar evidencia para construcciones
psicológicas no observables.) El conductismo ha tenido un amplio impacto en todas las áreas de la
psicología experimental y prospera hoy en muchas formas.
La psicología de la Gestalt comenzó, al igual que el conductismo, como una protesta exitosa
contra la psicología estructural, pero pronto se encontró compitiendo con el conductismo. Los
Gestaltistas encontraron el mismo elementalismo insatisfactorio en las descripciones del
comportamiento de los conductistas que habían encontrado en las de los estructuralistas, pero ahora
los elementos eran estímulos y respuestas. A su vez, los conductistas encontraron las construcciones
de los Gestaltistas tan borrosas y mal definidas como las de los estructuralistas y funcionalistas.
Además, los Gestaltistas a menudo se contentaban con hacer un punto u otro a través de
demostraciones simples, sin idear teorías claras y probarlas experimentalmente. Hasta cierto punto,
los Gestaltistas y los conductistas investigaban diferentes áreas, y los Gestaltistas se preocupaban princ
La era de estas escuelas de psicología declinó alrededor de 1940 y esta forma de dividir estrictamente el
campo de la psicología ya no es rentable. La infl uencia de las escuelas sigue viva en la investigación
contemporánea, pero la organización del campo se encuentra en líneas diferentes. Se ha escrito muy poco
sobre la historia de la psicología desde 1940 porque todavía hay pocos temas unificadores aparentes.
Esbozamos aquí, sin embargo, algunas tendencias modernas.
Durante la Segunda Guerra Mundial, los psicólogos se emplearon en ocupaciones tan diversas como
estudiar la opinión pública y la propaganda, ayudar en las relaciones raciales en las fuerzas armadas,
entrenar animales para ayudar en situaciones de combate, diseñar cabinas de aviones complicados,
construir pruebas para la selección de personal y tratar con problemas clínicos de fatiga de batalla,
depresión, etc. Los psicólogos se vieron obligados a abandonar sus retiros escolares y se les animó a
aplicar sus conocimientos a los numerosos problemas que tenían entre manos. En muchos casos, este
contacto con problemas del mundo real les permitió ver lo inadecuado de sus conceptos y les brindó la
oportunidad de desarrollar nuevas y mejores ideas.
Así, la guerra tuvo una influencia saludable en muchas áreas de la psicología. Durante este período, los
factores humanos, entonces llamados ingeniería humana, llegaron a ser una disciplina propia.
Otra tendencia que se produjo aproximadamente al mismo tiempo fue la extensión del método
experimental a áreas problemáticas a las que no se había aplicado anteriormente. La psicología social
experimental y la psicología infantil experimental recibieron una atención considerable durante las décadas
de 1930 y 1940.
El conductismo dominó la psicología estadounidense durante las décadas de 1930 y 1940, y debido a
que se evitó el estudio de los eventos no observables, el estudio de los procesos mentales fue
prácticamente abandonado durante este tiempo. Sin embargo, varios desarrollos en la década de 1950
reinstauraron el estudio científico de los procesos mentales superiores como un esfuerzo legítimo y factible
(aunque difícil).
El uso de medidas como la frecuencia cardíaca, la dilatación de la pupila (una parte del ojo, no de
un estudiante) y las ondas cerebrales puede ayudar al psicólogo cognitivo a investigar las propiedades
fundamentales (Jennings & Coles, 1991a). Las técnicas de imágenes cerebrales, como la resonancia
magnética funcional (fMRI, por sus siglas en inglés) , se están volviendo cada vez más populares
entre los neurocientíficos cognitivos; fMRI funciona midiendo un correlato de la actividad cerebral, a
saber, el flujo sanguíneo y la oxigenación, en respuesta a una actividad cognitiva específica (p. ej., consulte
Especialización
Quizás la tendencia reciente más notable en psicología es la especialización. Las escuelas de
psicología tendían a abarcar todo; tenían algo que decir sobre cada fase de lo que consideraban
psicología. Por ejemplo, los conductistas no se preocuparon solo por aprender, aunque este era
su principal interés; también aplicaron sus conceptos a las áreas de pensamiento, lenguaje y
desarrollo infantil. Ahora los psicólogos ya no se identifican por escuelas sino por áreas de
interés. La mayoría de los departamentos de psicología están organizados de esta manera, al
igual que los capítulos 6 a 15 de este libro.
Los psicólogos pueden ser psicólogos sociales, psicólogos del aprendizaje animal,
psicólogos del desarrollo, psicólogos cognitivos (sensación, percepción, memoria, lenguaje,
pensamiento, procesamiento de información, etc.), psicólogos de la personalidad, etc. O los
psicólogos pueden especializarse en psicobiología, psicología clínica o psicología organizacional
o industrial. Y todas estas áreas tienen subáreas, como las que acabamos de enumerar para la
psicología cognitiva. Es muy probable que los trabajadores dentro de estos campos sepan muy
poco sobre las otras áreas. Esta tendencia hacia la especialización a menudo se considera
desafortunada, pero parece haber pocas alternativas. Tal especialización es simplemente la
marca de una ciencia madura, porque la posibilidad de que un psicólogo pueda ser conocedor
en todas las áreas de la psicología actual es pequeña.
La psicología experimental es sólo una de las cincuenta y tres divisiones de la Asociación
Americana de Psicología. Sin embargo, muchos psicólogos pertenecientes a otras áreas emplean
el método experimental en su trabajo. (Por otro lado, los miembros de algunos campos se
oponen al uso del método experimental en psicología.) La lista en la Tabla A.2 le da una idea de
la gran diversidad y especialización que se encuentra entre los actuales
ÿ RESUMEN
1. La psicología científi ca tiene unos cien años, más o menos técnicas podrían proporcionar información sobre temas
una década. Las raíces de la psicología se encuentran en psicológicos.
las preguntas formuladas por los filósofos durante miles de 3. Weber examinó cuánto tenía que cambiar un estímulo para
años. Las técnicas originales para el estudio experimental que un observador notara la diferencia. Descubrió que la
de la psicología fueron ideadas por físicos y fisiólogos que cantidad de cambio necesaria para una diferencia apenas
se interesaron por los temas psicológicos, en particular los perceptible (jnd) era una proporción constante de la
relacionados con la recepción de estímulos por los sentidos. magnitud del estímulo estándar, un hecho que se conoció
como la ley de Weber. Fechner
2. Cuatro de los primeros pioneros de la psicología fueron continuó el trabajo de Weber y acuñó el término psicofísica,
Helmholtz, Weber, Fechner y Ebbinghaus. En un que se ocupaba de cómo los cambios en el mundo físico
experimento temprano de tiempo de reacción, Helmholtz se relacionan con la percepción de los cambios por parte
midió la velocidad del impulso nervioso, demostrando así cómo experimental
de una persona.
ÿ TABLA A.3
psicología de la gestalt Experiencia subjetiva, con Para entender los fenómenos de Informes subjetivos; alguno
énfasis en la percepción, experiencia consciente en términos de medidas de comportamiento;
ÿ TÉRMINOS CLAVE
afectos introspección
behaviorismo diferencia apenas perceptible (jnd)
Psicología cognitiva procesamiento distribuido paralelo (PDP)
dualismo psicofísica
ley de fechner psicofisiología
resonancia magnética funcional (fMRI) experimento de tiempo de reacción
funcionalismo sensación
psicología de la gestalt constancia de forma
ideas error de estímulo
imágenes estructuralismo
Teoría de la información ley de Weber
CONEXIONES WEB
Una cronología de eventos importantes en la psicología estadounidense se encuentra en:
http://www.cwu.edu/~warren/today.html
Este sitio contiene muchos enlaces a sitios relacionados con la historia de la psicología:
http://elvers.stjoe.udayton.edu/history/welcome.htm
APÉNDICE B
ESTADÍSTICO
RAZONAMIENTO: UN
INTRODUCCIÓN
Medidas de dispersión
Una nota sobre el cálculo
La distribución normal
Coeficiente de correlación
ESTADÍSTICA INFERENCIAL
Muestreo
Prueba de hipótesis
El análisis de varianza
2
Prueba de Independencia
RESUMEN
TÉRMINOS CLAVE
CONEXIONES WEB
El propósito de este apéndice es darle una idea de por qué la comprensión de la estadística es crucial para
la realización e interpretación de la investigación psicológica. También prestamos atención a cómo se utiliza
el razonamiento estadístico en la investigación psicológica, aunque difícilmente podemos esperar convertirlo
en un experto estadístico al leer esta sección. Este apéndice sirve como repaso para aquellos de ustedes que
ya han tomado estadísticas. Los estudiantes nuevos en estadística pueden necesitar leer la sección varias
veces con mucho cuidado, ya que hay bastante información nueva. Es posible que ya sepa que si tuviera que
completar el trabajo de posgrado para el Ph.D. en psicología, probablemente se le pedirá que tome un mínimo
de tres cursos de estadística.
Muchos aspectos del mundo en que vivimos pueden tratarse en términos de probabilidades. No siempre
sabemos con total certeza que ocurrirán los eventos, sino que ocurrirán en una cierta proporción del tiempo o
con cierta probabilidad. Un ejemplo común es el pronóstico del tiempo. Los meteorólogos dicen que hay un
80 por ciento de posibilidades de lluvia o un 20 por ciento de posibilidades de nieve, dadas ciertas condiciones
previas. Incluso cuando se conocen las condiciones previas, es imposible predecir perfectamente el clima
futuro. Gran parte del comportamiento humano es probabilístico en el mismo sentido. Las estadísticas
inferenciales son útiles para ayudar a los psicólogos a estimar la probabilidad de que las diferencias en
grupos de observaciones entre dos condiciones se hayan producido por factores aleatorios o fortuitos.
Las estadísticas descriptivas ayudan a los psicólogos a resumir o describir las observaciones. Primero
examinamos las estadísticas descriptivas y luego pasamos a las estadísticas inferenciales.
Cuando llevamos a cabo un experimento y medimos una variable independiente, típicamente producimos
una gran variedad de números. ¿Qué vamos a hacer con ellos? Primero, necesitamos crear un sistema y
organizarlos. No tenemos que mirar toda la gama de números producidos por los sujetos en las diferentes
condiciones del experimento; en cambio, podemos ver una versión más breve. Al resumir los datos, podemos
ver tendencias generales que de otro modo estarían ocultas por la gran variedad de números. Las estadísticas
descriptivas proporcionan esta función de organización y resumen. Los dos tipos principales son medidas de
tendencia central (la puntuación típica) y medidas de dispersión (la dispersión de los datos).
Tomemos una situación experimental hipotética. Una compañía farmacéutica ha patrocinado una prueba
de los efectos del LSD en el comportamiento de las ratas, por lo que decidimos ver cómo la droga afecta la
velocidad de carrera de las ratas. Cuarenta ratas privadas de comida han sido entrenadas para correr un
laberinto de callejones rectos por una recompensa de comida. Los asignamos aleatoriamente a dos grupos.
A un grupo, le administramos LSD por inyección y observamos el efecto sobre la velocidad con la que corren
por el callejón en busca de comida 30 minutos después de la inyección. El otro grupo se prueba de manera
similar 30 minutos después de recibir una inyección de placebo. Los siguientes son los tiempos de ejecución
para los 20 sujetos de control en segundos: 13, 11, 14, 18, 12, 14, 10, 13, 13, 16, 15, 9, 12, 20, 11, 13, 12, 17,
15 y 14. Los tiempos de ejecución para los sujetos que reciben las inyecciones de LSD
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Tiempo (segundos)
Experimental
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
Tiempo (segundos)
son 17, 15, 16, 20, 14, 19, 14, 13, 18, 18, 26, 17, 19, 13, 16, 22, 18, 16, 18 y 9. Ahora que tenemos los
tiempos de ejecución, ¿Qué hacemos con ellos? Una cosa que podríamos querer es una representación
gráfica de los números, como en los dos histogramas que se muestran en la figura B.1.
Aquí, los tiempos de ejecución en segundos aparecen a lo largo de la abscisa (eje X), y la frecuencia con la
que ocurrió cada tiempo en las dos condiciones se muestra a lo largo de la ordenada (eje Y). Los tiempos
de ejecución para los sujetos de control se dan en el histograma superior; los de los sujetos experimentales
están representados en la parte inferior. Otra forma de representar la misma información es usar un polígono
de frecuencia. Su construcción es equivalente a la del histograma; puede visualizar este tipo de gráfico
conectando los puntos medios de las barras en el histograma. Los polígonos de frecuencia idealizados
aparecen más adelante en el apéndice (en la Figura B.2). En ambas condiciones de la Figura B.1, el mayor
número de puntajes ocurre en el medio; tienden a colarse hacia los extremos. Esto es más obvio para el
control que para los sujetos experimentales. Además, los tiempos del grupo experimental tienden a ser
mayores que los del grupo de control. Tanto el histograma como el polígono de frecuencias son tipos de
distribuciones de frecuencia. Ayudan a sistematizar un poco los datos, pero hay descripciones resumidas
más eficientes.
Tendencia central
La descripción resumida más común de los datos es alguna medida de tendencia central que, como implica
el término, indica el centro de la distribución de puntuaciones. Con mucho, la medida de tendencia central
más típica en la investigación psicológica es la media aritmética. La media (X¯) es simplemente la suma de
todas las puntuaciones
¯ (X) dividida por el número de puntuaciones (n), o XX/ n. Es lo que la mayoría de la
gente considera como el promedio de un conjunto de
Medidas de dispersión
Las medidas de tendencia central indican el centro de las puntuaciones, mientras que las medidas
de dispersión indican cómo se distribuyen las puntuaciones alrededor del centro. Al decidir sobre
una medida de dispersión, queremos proporcionar un número que refleje la cantidad de dispersión que
X ( XX ) |X X | X ( XX ) |X X |
los puntajes se exhiben en torno a alguna medida de tendencia central, generalmente la media.
Una de esas medidas que sería apropiada es la desviación media. Esto se calcula tomando la
diferencia entre la media y cada puntaje en una distribución, sumando estas diferencias y luego
dividiendo por el número de puntajes. Sin embargo, en realidad es necesario tomar la diferencia
absoluta media (es decir, ignorar el signo de la diferencia: si la puntuación es mayor o menor
que la media). La razón es que la suma de las desviaciones de las puntuaciones con respecto
a la media siempre es cero, una característica definitoria de la media (ver Tabla B.1). Por lo
tanto, la desviación media debe ser la desviación media absoluta. Las desviaciones medias
para nuestras condiciones experimentales hipotéticas en el experimento LSD se calculan en la Tabla
El símbolo indica el valor absoluto de un número: 6 6.
La desviación media absoluta de un conjunto de puntajes es una medida adecuada de
dispersión y se basa en la misma lógica involucrada en encontrar la media de una distribución.
Sin embargo, la desviación estándar y la varianza (definidas más adelante) son preferibles a la
desviación media porque tienen propiedades matemáticas que las hacen mucho más útiles en
cálculos estadísticos más avanzados. La lógica detrás de su cálculo es bastante similar a la de
la desviación media, razón por la cual hemos considerado aquí la desviación media. Al calcular
la desviación media, tuvimos que tomar el valor absoluto de la diferencia de cada puntuación
con respecto a la media, para que estas diferencias no sumaran
donde s 2
representa la varianza, X las puntuaciones individuales, X¯ la media y n el número de
puntuaciones u observaciones. Aunque la varianza es un número útil, describe la dispersión en unidades al
cuadrado (tiempos de ejecución al cuadrado en este ejemplo), lo que a menudo no es muy útil. Para volver a
la unidad de medida original, todo lo que tenemos que hacer es sacar la raíz cuadrada de la varianza. La
desviación estándar resulta de sacar la raíz cuadrada de la varianza y se representa por s (algunos textos
la denotan por sd). Desde s
es la unidad de medida original, esta y la media se presentan juntas para describir una distribución de
puntajes. Como se verá más adelante, la varianza se usa principalmente para calcular otras estadísticas,
como F, que es una estadística inferencial.
_
2
ÿ( ÿXX
) (B.2)
s =
norte
El cálculo de las desviaciones estándar para el control y las condiciones experimentales del experimento LSD
por el método de desviación media se ilustra en la Tabla B.2.
Las fórmulas para la varianza y la desviación estándar de una distribución dadas en las Ecuaciones B.1
y B.2 son bastante engorrosas; en la práctica, se utilizan fórmulas de cálculo equivalentes. La fórmula de
cálculo de la desviación estándar es
2 _
ÿ X 2
s = ÿ
X (B.3)
norte
X 2
(B.4)
norte
El valor en cada caso es el mismo que se obtiene cuando se utiliza la fórmula de definición.
Al describir una serie de datos, los psicólogos suelen presentar dos estadísticas descriptivas, la media
y la desviación estándar. Aunque existen otras medidas de tendencia central y dispersión, éstas son más
útiles para fines descriptivos. La varianza se usa ampliamente, como veremos, en estadística inferencial.
A lo largo de este apéndice, ilustramos los procedimientos estadísticos con cálculos detallados, como se
hace en la Tabla B.2. Hacemos esto con la esperanza de que la lógica detrás de los cálculos se aclare. Sin
embargo, es muy posible que nunca tenga que
X ( XX ) ( XX )2 X ( XX ) ( XX )2
_ _
2 2
ÿ( ÿXX
) ÿ( ÿXX
)
s= s=
norte norte
.
138 80 .
247 80
s= s=
20 20
$ 2.63 3,52 _
La distribución normal
Los gráficos de los puntajes del experimento hipotético de LSD en la figura B.1 muestran que los
puntajes se acumulan en el medio pero disminuyen hacia los extremos (colas) de la distribución de
puntajes. Aunque estos números son hipotéticos, este tipo de distribución tiene una propiedad que
ocurre con la mayoría de las medidas de comportamiento. Es decir, para la mayoría de los fenómenos
que se miden, las puntuaciones se agrupan en el centro de la distribución. Esta configuración se
denomina curva normal, un ejemplo de la cual se presenta en la Figura B.2 (la curva
B
Frecuencia
Puntaje
ÿ FIGURA B.2
etiquetado B). Cuando se colocan en un gráfico, los datos psicológicos suelen ser más numerosos en el
medio del conjunto de puntajes; disminuyen en frecuencia con la distancia desde el centro de una manera
aproximadamente simétrica. Una puntuación de 10 puntos por debajo del centro de la distribución ocurre
con tanta frecuencia como una puntuación de 10 puntos por encima del centro.
Las tres curvas que se muestran en la Figura B.2 son todas simétricas. En tales distribuciones de
puntajes, la media y la mediana de la distribución caen en el mismo punto o puntaje.
Las curvas con la misma media y mediana pueden diferir en su variabilidad, al igual que las curvas de la
Figura B.2. La curva alta y delgada etiquetada como A tendría una desviación estándar más pequeña
que las otras dos. De manera similar, la curva amplia y plana (C) tendría una desviación estándar mayor
que las otras dos.
La curva normal tiene una propiedad muy útil. Resulta que una proporción específi ca de puntajes
cae debajo de cada parte de la curva normal. Esta característica se ilustra en la Figura B.3.
A cada lado de la curva normal de la figura B.3, hay un punto en el que la curva invierte ligeramente su
dirección; comienza a doblarse hacia afuera más. Esto se llama el punto de inflexión.
El punto de inflexión en la curva es siempre una desviación estándar de la media. De hecho, la curva
normal tiene la propiedad útil de que proporciones específicas de la distribución de puntajes que
representa están contenidas dentro de áreas específicas de la curva misma. Alrededor del 68 por ciento
de todos los puntajes están contenidos dentro de una desviación estándar de la media (34 por ciento en
cada lado). De manera similar, casi el 96 por ciento de los puntajes están dentro de dos desviaciones
estándar de la media, y el 99.74 por ciento de los puntajes están dentro de tres desviaciones estándar.
El porcentaje en cada área se muestra en la Figura B.3.
Esta propiedad de las curvas normales es extremadamente útil: si conocemos la puntuación de un
individuo y la media y la desviación estándar en la distribución de puntuaciones, también
2,14% 2,14%
0,13% 0,13%
13,59% 34,13% 34,13% 13,59%
–4 –3 –2 –1 0 +1 +2 +3 +4
Desviaciones estándar o
Unidades de puntuación estándar (z)
ÿ FIGURA B.3
Proporciones de puntajes en áreas específi cas bajo la curva normal. Los puntos de inflexión
están a una desviación estándar de la media.
conocer el rango relativo de la persona. Por ejemplo, la mayoría de las pruebas de coeficiente intelectual están
diseñadas para que la media de la población sea 100 y la desviación estándar sea 15. Si una persona tiene un
coeficiente intelectual de 115, sabemos que obtuvo una puntuación superior al 84 por ciento de todas las personas en
la prueba ( 50 por ciento de las personas por debajo de la media y 34 por ciento por encima). Del mismo modo, una
persona con un coeficiente intelectual de 130 ha obtenido una puntuación superior a casi el 98 % de todas las personas,
y una persona con un coeficiente intelectual de 145 ha obtenido una puntuación superior al 99,87 % de la población.
Muchas distribuciones de puntajes en datos psicológicos son, o al menos se supone que son, normales. Es
común comparar puntajes a través de distribuciones normales con diferentes medias y varianzas en términos de
puntajes estándar o puntajes z. Esta es simplemente la diferencia entre una puntuación individual y la media,
expresada en unidades de desviaciones estándar. Entonces, un CI de 115 se traduce en una puntuación z de 1,00, es
decir, [115 – 100]/15, y un CI de 78 se traduce en una puntuación z de ÿ1,47, es decir, [78 – 100]/15. Los puntajes
estándar son útiles porque permiten la comparación de los rangos relativos de puntajes para las personas en
distribuciones en las que las medias y las desviaciones estándar varían mucho. Las calificaciones de los cursos deben
calcularse en términos de puntajes z si las medias y las desviaciones estándar de los puntajes varían mucho de una
prueba a otra. Por lo tanto, el rango final de una persona en la clase se calcula más fielmente encontrando la media de
las puntuaciones z que encontrando la media de las puntuaciones brutas de las pruebas.
Coeficiente de correlación
Informática
Llamemos a un conjunto de números en la tabla B.3. puntajes X y el otro conjunto de puntajes Y.
pearson _
Por ejemplo, los tamaños de la cabeza pueden ser puntajes X y las palabras recordadas puntajes
Y. La fórmula para calcular Pearson r a partir de las puntuaciones brutas en los paneles (a), (b) o
(c) de la tabla 2.1 es
n ÿXY XY)(ÿ )
ÿ (ÿ
=
2 2 22 (B.5)
ÿ XX
ÿ ÿ nY
(ÿ )Ynorte
ÿ ÿ ÿÿ ÿ ÿ (ÿ ) ÿ ÿÿ
La n se refiere al número de sujetos sobre los que se toman observaciones (aquí, 10); los
términos X e Y son los totales de las puntuaciones X e Y , respectivamente; X2 e Y2 son
la suma de todos los valores de X (o Y ) después de elevarlos al cuadrado; y (X)2 y
(Y)2 son el total de todos los valores de X o Y con todo el total o suma al cuadrado. Esto
deja el valor XY, o la suma de los productos cruzados.
ÿ TABLA B.3
X Y
( 6915. 90 )426
( 10 . )(
ÿ 70 151 )
r=
2 2
ÿ ÿ( 10 . ) - ( 426 .70 )
( ) 19 .709 21 ( 10
ÿ (ÿ ÿÿ( ) 2451 )151
ÿ ) ÿÿ
69 ,.159
,. 00 64 431 70
ÿ
r=
[197 ,.092
,. ][10 182 072 89
ÿ
24 ,510 22 801
ÿ
, ]
4727 30
.
. ,.
019 21 1709 [ ][ ] = r = 4727 30 15
25 ,667 82
, 9 89 .
4727 30
.
r=
5066 34
.
r 0.93
continuado
ÿ ESTADÍSTICA INFERENCIAL
Las estadísticas descriptivas conducen a un resumen de los resultados del experimento con LSD de la
siguiente manera: el tiempo medio de ejecución para el grupo de control fue de 13,6 segundos, con
una desviación estándar de 2,63, mientras que los sujetos experimentales inyectados con LSD tuvieron
una media de 16,9 segundos y una desviación estándar de 3.52. ¿Deberíamos tomar en serio la
diferencia de 3,3 segundos entre los tiempos medios de ejecución? Tal vez se deba simplemente a
factores aleatorios, como un error de medición o el hecho de que algunas ratas en el grupo de control
tuvieron un día particularmente bueno y, por lo tanto, tenían ganas de correr un poco más rápido. ¿Qué
tan grande debe ser la diferencia para que concluyamos que es poco probable que haya ocurrido solo
por casualidad? La estadística inferencial se utiliza para responder a esta pregunta.
El procedimiento no es demasiado complicado. Elegimos una prueba estadística apropiada para
la situación experimental, realizamos algunos cálculos sencillos en una calculadora (o computadora) y
luego consultamos una tabla especial. La tabla nos informa de la probabilidad de que la diferencia que
hemos encontrado entre nuestras condiciones sea resultado de factores aleatorios.
Si es suficientemente improbable que haya ocurrido por casualidad, concluimos que la diferencia es
estadísticamente significativa. Pero, aunque los procedimientos computacionales reales suelen ser
bastante simples, es necesario comprender la lógica detrás de ellos para poder apreciar cómo se
realizan las inferencias estadísticas.
Muestreo
Una población es un conjunto completo de medidas (o individuos u objetos) que tienen alguna
característica observable común. Ejemplos de poblaciones son todos los ciudadanos estadounidenses
en edad de votar y todas las ratas albinas que han recibido inyecciones de LSD. Es imposible estudiar
a toda la población en cada caso. Si pudiéramos medir la velocidad de carrera de toda la población de
ratas después de una inyección de LSD o una inyección de una sustancia químicamente inerte,
entonces sabríamos mejor cuáles fueron los efectos del LSD, ya que habríamos medido a toda la
población. (Cualquier diferencia podría, por supuesto, atribuirse a un error de medición.) Pero dado que
casi siempre es poco práctico medir una población completa, debemos tomar muestras de ella. Una
muestra es un subconjunto de una población; esto es casi siempre lo que estamos examinando cuando
comparamos las condiciones experimentales. Hacemos inferencias estadísticas, luego sacamos una
conclusión que se basa
Las muestras deben ser siempre lo más representativas posible de la población objeto de estudio. Una
forma de lograr esto es a través del muestreo aleatorio, mediante el cual los miembros se eligen de la
población por algún medio completamente arbitrario. (El muestreo aleatorio a menudo se lleva a cabo usando
una tabla de números aleatorios, como la de la Tabla H en el Apéndice C). Técnicamente, solo podemos
generalizar a la población de la que hemos muestreado, aunque si se toma literalmente, esto haría que la
investigación experimental apenas valiera la pena. Si recibimos 50 ratas de una casa de suministros para
nuestro experimento hipotético, seleccionamos una muestra de 40 y las asignamos al azar a las dos
condiciones del experimento, ¿serían verdaderas nuestras conclusiones solo para la población de 50 ratas?
Tal vez técnicamente, pero a nadie le importaría el resultado si fuera así, y nadie habría perdido el tiempo
haciendo el experimento.
Al menos querríamos suponer que los resultados son característicos de esa cepa de ratas. En la práctica, los
psicólogos asumen que sus resultados se generalizan más ampliamente que la población limitada de la que
tomaron muestras para su experimento. Consideramos el problema de la generalidad de los resultados y la
base de esta suposición con más detalle en los capítulos 10 y 14.
Recuadro B.2
Estadístico Las características de una población de puntajes se denominan parámetros, mientras que las
Notación características de una muestra de puntajes extraída de una gran población son estadísticas. La
media de toda una población de puntajes es un parámetro, y la media de una muestra es una
estadística. Para mantener estas distinciones, se utilizan diferentes símbolos para los parámetros
de población y las estadísticas de muestra. Algunos de los símbolos más frecuentes se enumeran
aquí. Algunos han sido explicados; los otros se discuten en las próximas páginas.
N = número de puntajes en una población
n = número de puntajes en una muestra
µ = media de la población (µ se pronuncia “en”)
X¯ = media muestral
2
= varianza de la población (se pronuncia
_
“sigma”)
2
ÿ( ÿ ) XX
s2 = varianza muestral _
norte 2
ÿ( ÿ ) XX
sˆ2 = estimación no sesgada de la varianza de la población
norte
ÿ
1
= desviación estándar de la población
s = desviación estándar de la muestra
sˆ = desviación estándar de la muestra basada en la estimación de la varianza no sesgada
Intervalo Frecuencia
62,0–63,9 1
60,0–61,9 1
58,0–59,9 3
56,0–57,9 7
54,0–55,9 9
52,0–53,9 12
50,0–51,9 15 Media de las medias muestrales 49,99
48,0–49,9 15 Desviación estándar (s) de
46,0–47,9 13 muestra media 5.01
44,0–45,9 9
42,0–43,9 6
40,0–41,9 3
38,0–39,9 1
36,0–37,9 1
96 muestras
¿Es realmente fiable la diferencia de 3,3 segundos entre la media experimental y la de control en
nuestro experimento hipotético con LSD?
= (B.6)
X
norte
Ahora, si todavía está con nosotros, es posible que esté pensando: “Fantástico. ¿De qué me sirve
esto, ya que la desviación estándar de la población, el numerador en la Ecuación B.6, nunca se
conoce?” Eso también se les ha ocurrido a los estadísticos, por lo que han ideado un método para
estimar la desviación estándar de la población a partir de la desviación estándar de una muestra. Si
observa la Ecuación B.2, donde la fórmula para la desviación estándar
Intervalo Frecuencia
55,0–55,9 1
54,0–54,9 3
53,0–53,9 5
52,0–52,9 9
51,0–51,9 13
50,0–50,9 17
49,0–49,9 dieciséis
Media de medias muestrales- -49.95
48,0–48,9 14 Desviación estándar (sˆ) de las medias muestrales- -2.23
47,0–47,9 9
46,0–46,9 6
45,0–45,9 2
44,0–44,9 1
96 muestras
de una (s) muestra (s) , y simplemente reemplace la n en el denominador por n 1, entonces tiene la
, para
fórmula para obtener una estimación imparcial de la desviación estándar de laencontrar
población.elLa
error
ecuación
estándar de distribución de medias muestrales (llamado error estándar de la media, o ˆs
) es
X
ˆ
ˆ s
Estimado s== (B.7)
XX
norte
Obviamente, queremos que el error estándar de la media sea lo más pequeño posible, ya que
representa el error que tenemos al suponer que nuestra media muestral representa la media
poblacional. Las ecuaciones B.6 y B.7 nos dicen cómo hacer esto: aumentar el tamaño de la muestra,
n, lo que aumenta el denominador en las ecuaciones. Cuanto mayor sea n, el tamaño de la muestra,
Cuanto menor sea el error estándar de la media, la poblaciónX es, . Esto no debería ser una sorpresa. Si el
involucra 1,000 puntajes, la media de la muestra debe estar más cerca de la media de la población si
hay 500 observaciones en la muestra que si solo hay 10.
Horowitz llevó este punto a los 96 estudiantes de su clase al pedirles que repitieran el ejercicio
de sacar boletas de la población de 1000 puntajes y calcular la media nuevamente; pero esta vez les
pidió que muestrearan 50 hojas, en lugar de solo 10. La distribución resultante de las medias muestrales
se da en la tabla B.5. Esta vez, con muestras más grandes, hay mucha menos variabilidad en las
medias muestrales obtenidas por los estudiantes. Están mucho más cerca de la media poblacional real
de 50. La desviación estándar de la distribución de las medias muestrales, o el error estándar de la
media, es 2,23, a diferencia de 5,01 cuando el tamaño de la muestra era solo 10. Si n = 100 en una
muestra de las 1000 puntuaciones, el error estándar
La lección que se debe aprender es que siempre debemos tratar de maximizar el número de
observaciones —el tamaño de la muestra— en condiciones experimentales, de modo que las
estadísticas obtenidas se acerquen lo más posible a los parámetros de la población.
Prueba de hipótesis
Los científicos organizan experimentos para probar hipótesis. La lógica estadística convencional
para probar hipótesis funciona más o menos así. Un experimentador dispone condiciones, como la
experimental (LSD) y la de control (placebo) en nuestro experimento con ratas, para probar una
hipótesis experimental. La hipótesis experimental en este caso es que el LSD tendrá algún efecto
sobre la velocidad de carrera. Esto se prueba comparándolo con la hipótesis nula, que sostiene
que las dos condiciones no difieren en sus efectos sobre la velocidad de carrera. Dicho de otra
manera, la hipótesis experimental es que las muestras de velocidades de carrera provienen de dos
poblaciones subyacentes diferentes (es decir, poblaciones con distribuciones diferentes); la hipótesis
nula es que las dos muestras provienen de la misma distribución.
Una suposición crítica es que es imposible probar la hipótesis alternativa de manera concluyente,
ya que siempre existe alguna posibilidad de que las dos muestras provengan de la misma población,
sin importar cuán diferentes parezcan. Sin embargo, lo que nos permite hacer la estadística inferencial
es determinar cuán confiados podemos estar al rechazar la hipótesis nula. La hipótesis alternativa se
prueba así indirectamente; si podemos confiar bastante en rechazar la hipótesis nula, supondremos
que la hipótesis alternativa es correcta y que existe una diferencia real entre las puntuaciones en las
diferentes condiciones. Los psicólogos han acordado, por convención, que si los cálculos de una
prueba estadística muestran que hay menos de 0,05 de probabilidad (un 5 por ciento de probabilidad)
de que la hipótesis nula sea correcta, podemos rechazarla y aceptar la hipótesis alternativa.
La curva normal, la distribución de las medias muestrales y las puntuaciones z se pueden usar para
ayudarnos a determinar la probabilidad de que la hipótesis nula sea falsa. Cuando se toman muestras
no sesgadas de una población más grande, normalmente se distribuyen las medias de estas muestras.
Con distribuciones normales, podemos especificar qué proporción de la distribución cae debajo de cada
parte de la curva, como se ve en la Figura B.3. Por último, recuerda también que
=
Con
(B.8)
X
Para explicar cómo se llega a esta notable conclusión, necesitamos referirnos nuevamente a la
propiedad especial de la curva normal, que es que una cierta proporción de casos cae bajo cada parte de la
curva. La figura B.3 muestra que una puntuación z de ±2,00 es altamente improbable. Los puntajes más
altos en cualquier dirección ocurren solo el 2.15 por ciento del tiempo. En otras palabras, la probabilidad de
tal ocurrencia es 0.0215. Esto también está por debajo del nivel de significación (o nivel de confianza) del 5
por ciento o 0,05, por lo que se considera que cualquier puntuación media de dos o más desviaciones
estándar de la media de la población, utilizando la lógica que hemos esbozado aquí, es confiablemente
( significativamente) diferente de la media poblacional. De hecho, el valor z crítico para rechazar la hipótesis
nula al nivel de confianza de 0,05 es ±1,96. La Tabla A en el Apéndice C presenta (1) puntajes z de cero a
cuatro, con (2) la cantidad de área entre la media y z, y (3) lo más importante, la cantidad de área más allá
de z. La cantidad de área más allá de z es la probabilidad de encontrar una puntuación tan distante de la
media basándose únicamente en el azar. Una vez más, cuando esta probabilidad cae por debajo de 0,05,
como ocurre con puntuaciones z de 1,96 (o más), rechazamos la hipótesis nula. Con una z de 2,67, como en
nuestro ejemplo de CI, la probabilidad de que ocurra una ocurrencia tan rara es solo 0,0038.
El problema estadístico que acabamos de considerar (comparar la media de una muestra con un
parámetro de la población para ver si la muestra proviene de esa población) es bastante artificial, ya que los
parámetros de la población rara vez se conocen. Pero este ejemplo exhibe características de las pruebas
estadísticas más comunes. En todas las pruebas, se realizan algunos cálculos sobre los datos o puntajes
brutos recopilados de un experimento; se encuentra un valor, como en el puntaje z recién calculado; y luego
este valor se compara con una distribución de valores para que podamos determinar la probabilidad de que
tal valor podría obtenerse si el valor nulo
ÿ TABLA B.6
Rechazar hipótesis nula Error tipo I: una decisión falsa Decisión correcta: esto es
de que existe un efecto, que determinado por el poder
ocurre con probabilidad. del experimento
No rechazar la decisión correcta Error de tipo II: una falla en
hipótesis nula detectar que el tratamiento
tuvo un efecto.
Pero no hay nada que podamos hacer sobre el tamaño de la diferencia entre las medias; está
arreglado. Lo que podemos hacer para aumentar el poder de nuestras pruebas estadísticas es aumentar el
tamaño de la muestra. En resumen, la razón de esto es que con muestras más grandes, podemos estar
más seguros de que nuestras medias muestrales representan las medias de las poblaciones de las que se
extraen y, por lo tanto, podemos estar más seguros de que cualquier diferencia entre una media muestral y
una media poblacional (o entre dos medias muestrales) es confiable. El tamaño de la muestra puede tener
un gran efecto en el poder de una prueba, como se muestra en la Tabla B.7. Se presentan las puntuaciones
z y los valores p para nuestra diferencia entre una media muestral de 108 puntos de CI y la media poblacional
de 100, ya que el tamaño de la muestra varía. Obviamente, a medida que varía el tamaño de la muestra,
también lo hará nuestra conclusión sobre si la muestra proviene de una población nacional o de una
población más restringida y con alto coeficiente intelectual. Si asumimos que la hipótesis nula es realmente
falsa aquí, entonces al aumentar el tamaño de la muestra, disminuimos la probabilidad de un error de tipo II
o aumentamos el poder de la prueba que estamos usando.
Una última cuestión a considerar es la especificación de la direccionalidad de las pruebas estadísticas.
De acuerdo con la lógica convencional involucrada en probar una hipótesis alternativa contra la hipótesis
nula, la hipótesis alternativa puede ser direccional o no direccional.
Si un experimento tiene un grupo experimental y otro de control, una hipótesis alternativa no direccional
sería simplemente que los dos grupos diferían en el desempeño de la variable dependiente. Pero una
hipótesis direccional establecería además la dirección predicha de la diferencia; por ejemplo, se puede
predecir que el grupo experimental lo hará mejor que el control.
Esta distinción es importante porque si la hipótesis alternativa es direccional, se usa una prueba
estadística de una cola (o de un lado) , pero si la hipótesis alternativa es no direccional, se usa una prueba
de dos colas (de dos lados) . Una contra dos “colas” se refiere a si al buscar un nivel p asociado con algún
valor determinado de la prueba estadística (digamos, z = 1.69), consideramos una o ambas colas de la
distribución (ver Figura B.4).
Esto debería ser más claro con referencia a nuestro ejemplo anterior. Tomamos una muestra (n = 25)
de estudiantes, determinamos que el coeficiente intelectual medio de la muestra era 108 y calculamos un z
= +2.67 en la prueba para ver si esto era diferente del coeficiente intelectual medio de la población de 100.
Si tuviéramos sin una expectativa previa de cómo el coeficiente intelectual de la muestra debería desviarse
de la población normal (si pensáramos que podría ser mayor o menor), esta habría sido una hipótesis no
direccional. De hecho, esperábamos que el coeficiente intelectual de la muestra fuera superior a 100, por lo
que estábamos probando una hipótesis direccional y, por lo tanto, usamos una prueba de una cola. Esto
significa que buscamos la puntuación z resultante en solo una cola de la distribución normal: la mayor que
cero. Un z = +2,67 conduce a un valor de p de una cola de 0,0038. Si la hipótesis fuera no direccional,
entonces no tendríamos derecho a priori a esperar que la
X ÿ
Con =
X
norte
X X Con
pags*
2,14% 2,14%
0,13% 0,13%
13,59% 34,13% 34,13% 13,59%
–4 –3 –2 –1 0 +1 +2 +3 +4
ÿ FIGURA B.4
Esta es la distribución normal estándar que se presenta en la Figura B.3. Hay dos lados, o colas, en la
distribución; positivo y negativo. Si un experimentador simplemente afirma que debe haber una diferencia
entre una condición experimental y una de control, pero no especifica la dirección de la diferencia, esto se
denomina hipótesis no direccional.
Si se encuentra z 2.67, es necesario buscar la probabilidad de que esto ocurra tanto en la cola positiva
como en la negativa de la distribución y sumar las dos, ya que el experimentador no ha especificado si la
diferencia debe ser positiva o negativa. Cuando el experimentador ha especificado la dirección o la
diferencia, basta con buscar la probabilidad en una cola. Dado que la distribución es simétrica, la probabilidad
de que se pueda rechazar la hipótesis nula es la mitad de grande con una prueba de una cola que con una
de dos colas. Cuanto menos seguro se esté del resultado de un experimento, mayor debe ser la diferencia
entre las condiciones para que se decida que no se debe al azar.
La prueba U de Mann-Whitney se usa cuando deseamos comparar dos muestras para decidir si provienen
de la misma o de diferentes poblaciones subyacentes. Se utiliza cuando las dos muestras están compuestas por
diferentes sujetos, o en diseños entre sujetos. El fundamento subyacente de la prueba de Mann-Whitney no se
discute aquí. En general, la lógica es la misma que en otras pruebas estadísticas en las que se calcula un valor a
partir de la prueba y se compara con una distribución de valores para determinar si se debe rechazar la hipótesis
nula. La forma en que se aplica la prueba de Mann-Whitney a los datos reales se describe en el recuadro B.3,
probando la confiabilidad de la diferencia entre las dos muestras en nuestro experimento hipotético con LSD.
Figura B.1
9 1.5 9 1.5
10 3.0 13 11.5
11 4.5 13 11.5
11 4.5 14 17.0
12 7.0 14 17.0
12 7.0 15 21.0
12 7.0 dieciséis 24.5
13 11.5 dieciséis 24.5
13 11.5 dieciséis 24.5
13 11.5 17 28,0
13 11.5 17 28,0
14 17.0 18 32,0
14 17.0 18 32,0
14 17.0 18 32,0
15 21.0 18 32,0
15 21.0 19 35.5
dieciséis 24.5 19 35.5
17 28,0 20 37.5
18 32,0 22 39.0
20 37.5 26 40,0
Nota: Cuando los puntajes estén empatados, asigne el valor medio de los rangos empatados a cada uno.
Por lo tanto, para ambos tiempos de 9 segundos en este ejemplo, se asigna el rango 1,5
(la media de 1 y 2).
Paso 2: Las ecuaciones para encontrar U y U' son las siguientes, donde n1 es el tamaño de la
muestra más pequeña, n2 es el tamaño de la más grande, R1 es la suma de los rangos de la muestra
más pequeña y R2 es el tamaño de la muestra más pequeña. suma de los rangos de la muestra más
grande. Obviamente, los subíndices de muestra son importantes solo si los tamaños de muestra son
desiguales, lo que no es el caso aquí.
= 12 +
nn (1 +)
1 ÿ ÿ1
U nn R
1
2
( 21
)( 20
EN ) 20 20 = ( )( ) + 2 ÿ
295 5. (B.9)
EN = 314 5.
nn (++) ÿ ÿ1
=12
U nn
ÿ
22 R
2
2
ÿ ( 21
)( 20
EN ) 20 20 = ( )( ) + 2 ÿ
524 5. (B.10)
EN
ÿ
= 85 5.
continuado
U n1n2 U'
o
U'n1n2 U _
Paso 3: Tome U o U', el valor que sea menor, y observe la Tabla B en el Apéndice C
para ver si la diferencia entre los dos grupos es confiable.
Los valores de la Tabla B se registran de acuerdo con diferentes tamaños de muestra. En
este caso, ambos tamaños de muestra son 20, por lo que el valor crítico de la tabla es 88.
Para que la diferencia entre los dos grupos se considere confiable, la U o la U' del
experimento debe ser menor que el valor apropiado en la Tabla B. Dado que 85.5 es menor
que 88, podemos concluir que la diferencia entre los dos grupos es confiable en el nivel de
confianza de .001.
Nota: La tabla B es apropiada solo para situaciones en las que los tamaños de las dos
muestras están entre 8 y 21. Para otros casos, debe consultar un texto avanzado.
La prueba de rangos con signo de Wilcoxon también se usa para probar la diferencia entre dos
muestras, pero en este caso, el diseño debe ser un diseño de medidas relacionadas. En otras
palabras, los mismos sujetos deben servir tanto en el grupo experimental como en el de control (un
diseño dentro de los sujetos) o los sujetos deben coincidir de alguna manera. Por supuesto, se
deben tomar precauciones en los diseños intra-sujetos para asegurar que alguna variable como la
práctica o la fatiga no se confunda con la variable de interés (ver Capítulo 3).
Pero siempre que el experimento se haya hecho bien, la prueba de los rangos con signo de Wilcoxon es una
herramienta apropiada para el análisis de los resultados.
Antes de considerar la prueba de los rangos con signo, examinaremos su prima más simple,
la prueba de los signos, que también es apropiada en las mismas situaciones. La prueba del signo
es la esencia de la sencillez. Supongamos que tenemos 26 sujetos sirviendo en ambas condiciones
de un experimento en el que estamos prediciendo que cuando los sujetos estén en la condición
experimental, lo harán mejor que cuando estén en la condición de control. Ahora suponga que 19
sujetos en realidad lo hacen mejor en la condición experimental que en el control, mientras que lo
contrario es cierto para los otros 7. ¿Es confiable esta diferencia? La prueba de signos nos permite
responder esta pregunta sin más información sobre cuáles fueron los puntajes reales. En términos
de la hipótesis nula, podríamos esperar que 13 sujetos se desempeñaran mejor en la condición
experimental y 13 en el control. La prueba de signos nos permite calcular la probabilidad exacta de
que la hipótesis nula sea falsa cuando hay 19 casos en la dirección predicha pero también siete
reversiones o excepciones. Resulta que la hipótesis nula se puede rechazar en este caso con un
nivel de confianza de 0,014 (una cola). Con una predicción no direccional, p es igual a 0,028 (dos cola
Una vez más, no podemos profundizar en los detalles de cómo se calcula esto, pero en la Tabla C
del Apéndice C, presentamos los niveles (una cola) para casos de tamaños de muestra de 3 a 42,
cuando hay x número de excepciones a la regla . hipótesis predicha. Entonces, por ejemplo, cuando
hay 16 sujetos en el experimento (recuerde, en ambas condiciones) y 13 muestran el patrón de
resultados predicho mientras que 3 exhiben reversiones, podemos rechazar la hipótesis nula en el
nivel de confianza de 0.011 (una cola). .
Recuadro B.4
Cálculo de la Imagine un experimento que pruebe si el curso de memoria del profesor Humboldt von Widget,
prueba de rangos “Cómo estreñir su mente recordándolo todo”, realmente funciona. Primero, a un grupo de 30 sujetos
con signo de se les presentan 50 palabras para recordar. Luego, los sujetos se separan al azar en dos grupos, y
Wilcoxon una verificación indica que los grupos no difieren de manera confiable en el número medio de
palabras recordadas. El grupo experimental recibe el curso de tres semanas del profesor von Widget,
mientras que el grupo de control no. Luego, los 30 temas se evalúan nuevamente en otra lista de 50
palabras. Los controles no muestran ninguna mejora de una lista a otra. La pregunta que nos
hacemos aquí es si la memoria de los sujetos experimentales mejoró de forma fiable. (Nota:
Podríamos, y deberíamos, también comparar el desempeño de los sujetos experimentales en la
segunda prueba con el de los controles.
Paso 1: coloque los datos en una tabla (como la que se muestra más adelante en este cuadro)
en la que se emparejen las puntuaciones de cada sujeto (antes y después del curso de memoria).
Encuentra y anota la diferencia entre los pares.
Paso 2: Clasifique los valores de las diferencias según el tamaño, comenzando con el más
pequeño. Ignora la señal. Usa los valores absolutos de los números. Para rangos empatados,
asigne a cada uno el valor medio de los rangos. (Consulte la columna de la derecha de la tabla
aquí).
Paso 3: Sume los rangos para todos los valores de diferencia que son negativos (5.5 + 2.5 + 8.5 +
5.5 = 22.0) y positivos (14 + 15 + 2.5 + 8.5 + 8.5 + 2.5+13 + 2.5 + 11.5 + 8.5 + 11.5 = 98.0). Estos
son los valores de rango con signo.
Paso 4: Tome el valor de rango con signo que sea más pequeño (22 en este caso) y vaya a la
Tabla D en el Apéndice C. Busque el número de pares de observaciones (enumerados como n a
la izquierda). Hay 15 en este caso. Luego mire el número bajo el nivel de significación deseado.
Dado que en este caso se predijo la dirección del resultado (esperábamos que el curso de la
memoria ayudara en lugar de perjudicar el recuerdo de las palabras), elijamos el valor por debajo
del nivel de significación de 0,025 para una continuación .
continuado prueba de cola Este valor es 25. Si el menor de los dos valores del experimento está por debajo
del valor apropiado en la tabla, entonces el resultado es confiable. Dado que 22 está por debajo
de 25, podemos concluir que el curso del profesor von Widget realmente ayudó a la memoria de
las palabras.
Nota: Recuerde que los controles no mostraron mejoría en el desempeño de una prueba
a la otra. Esta es una información crucial, porque de lo contrario no podríamos descartar dos
hipótesis plausibles en competencia. Una es que la mejora en la segunda lista se debió
simplemente a la práctica en la primera, y la otra es que la segunda lista fue más fácil que la
primera. En realidad, si el curso del profesor von Widget fuera tan efectivo como los numerosos
cursos de memoria actualmente en el mercado, los resultados de un experimento real mostrarían
(y han mostrado) una mejora más espectacular que los resultados hipotéticos aquí. Los cursos
de mejora de la memoria, todos los cuales incorporan los mismos principios, realmente
funcionan para materiales objetivos, como listas de palabras.
1 11 17 6 14.0
2 18 dieciséis 2 5.5
3 9 21 12 15.0
4 15 dieciséis 1 2.5
5 14 17 3 8.5
6 12 15 3 8.5
7 17 dieciséis 1 2.5
8 dieciséis 17 1 2.5
9 15 20 5 13.0
10 19 dieciséis 3 8.5
11 12 13 1 2.5
12 dieciséis 14 2 5.5
13 10 14 4 11.5
14 17 20 3 8.5
15 6 10 4 11.5
X 13.80 X16.07 _
Prueba t
En los Cuadros B.5 y B.6, presentamos las pruebas t correspondientes para los análisis presentados
en los dos cuadros anteriores. La prueba t es una prueba paramétrica; esto significa que asumimos que
las distribuciones subyacentes tienen una forma aproximadamente normal. Además, la prueba t y otras
pruebas paramétricas se diseñaron para usarse en datos que son al menos de naturaleza de intervalo.
La prueba U y la prueba de signos requieren solo datos ordinales. Las pruebas t se basan esencialmente
en puntajes z que tienen que ver con el error estándar de la diferencia entre medias. Por lo tanto, incluso
si las fórmulas computacionales parecen inusuales al principio, la lógica subyacente es la misma que
se analizó anteriormente en este apéndice.
Sujetos Prueba t
_ _
XX1 ÿ
t= 2
ÿ 2 2 ÿ
(ÿ) ÿX 1 (ÿ) X
ÿ ÿXÿ 2 +ÿ ÿ X 2 2
ÿ
(B.11)
1 2 ÿ 1
norte norte 1 ÿ
1 2 ÿ
ÿ+
ÿ
NN + ÿ 2 ÿ
NN ÿ
2 2 1 2 ÿÿ
ÿ ÿ
ÿ
ÿ
ÿ
ÿ
X X2 X X2 X X2 X X2
9 81 13 169 9 81 17 289
10 100 14 196 13 169 18 324
11 121 14 196 13 169 18 324
11 121 14 196 14 196 18 324
12 144 15 225 14 196 18 324
12 144 15 225 15 225 19 361
12 144 dieciséis 256 dieciséis 256 19 361
13 169 17 289 dieciséis 356 20 400
Paso 2: ahora sumamos las dos cifras de grupo que obtuvimos en el último paso (247.8 + 138.8) y
dividimos esta suma por N1 + N2 ÿ 2, para obtener 386.6/38 = 10.17.
Paso 3: El cociente obtenido en el Paso 2 (10,17) se multiplica por [(1/N1 + 1/N2)] para obtener (10,17)
(2/20) = 1,02.
Paso 4: Ahora sacamos la raíz cuadrada del producto obtenido en el Paso 3 para obtener
1 02 . 1.01.
Paso 5: Hallamos la diferencia absoluta entre las puntuaciones medias de los dos grupos (restando una
de la otra e ignorando el signo): 16,90 ÿ 13,60 = 3,30.
continuado
Recuadro B.6
Cálculo de un Los datos hipotéticos provienen del experimento del profesor von Widget (ver Cuadro B.4). La
Prueba t intra- fórmula computacional para la prueba t dentro de los sujetos es
sujetos
norte
ÿ
1
t = (B.12)
2 1
ÿ ND
ÿ (ÿD) ÿ 2 / ÿÿÿ
1 11 17 6 36
2 18 dieciséis 2 4
3 9 21 12 144
4 15 dieciséis 1 1
5 14 17 3 9
6 12 15 3 9
7 17 dieciséis 1 1
8 dieciséis 17 1 1
9 15 20 5 25
10 19 dieciséis 3 9
11 12 13 1 1
12 dieciséis 14 2 4
13 10 14 4 dieciséis
14 17 20 3 9
15 6 10 4 dieciséis
Paso 1: Después de organizar los puntajes de cada materia en pares, como se muestra en esta
tabla, registre la diferencia entre cada par, luego eleve al cuadrado cada una de estas diferencias.
puntuaciones de encia.
Paso 2: sume las puntuaciones de diferencia entre las materias, lo que produce D, luego eleve esta
suma al cuadrado. D = 35; (D) 2 = 1,225.
continuado
continuado Paso 3: Calcule la suma de las puntuaciones de diferencia al cuadrado para obtener D2 = 285.
Paso 6: Dividir el número de sujetos menos 1 (N ÿ 1) por el resultado del Paso 5: 14/2,49 =
5,62.
Paso 7: t es 5 62 . , o 2.37.
Paso 8: Para evaluar t, compárelo con el valor crítico que se muestra en la Tabla E estadística en el
Apéndice C. Ingrese la tabla con N ÿ 1 df. Para este estudio, df = 14. Con df = 14, el valor crítico de
t es 2,145 para p = 0,05. Dado que el t obtenido excede el valor crítico, podemos concluir que el
curso de von Widget realmente afectó el recuerdo de palabras.
¿Cómo sabemos que tenemos una variable independiente poderosa? Para determinar la magnitud
del efecto de la variable independiente, necesitamos una forma de mostrar el grado en que pertenecer a
un grupo en particular predice el comportamiento. En el ejemplo del Recuadro B.5, nos gustaría tener un
cálculo que nos permitiera tener una idea de si una rata había recibido un placebo o LSD. La información
que necesitamos es un coeficiente de correlación, porque queremos predecir lo que le sucedió a una rata
de la misma manera que nos gustaría predecir una puntuación de memoria basada en el tamaño de la
cabeza, como en el Cuadro B.1. Después de haber realizado una prueba t , podemos calcular una
correlación para evaluar la magnitud del efecto. El coeficiente de correlación que sería apropiado aquí es
rpb, que se denomina correlación biserial puntual . la fórmula es
(B.13)
2
2
r
pb (+ ) toneladas / t df =
La medida adicional más importante del tamaño del efecto que debe conocer es eta (), que se
utiliza para determinar qué tan equivocada es la hipótesis nula después de realizar una prueba F. Para
anticipar la discusión en la próxima sección, la prueba F en su forma más simple es muy parecida a la
prueba t , excepto que hay más de dos niveles de la variable independiente (digamos, varias dosis de
LSD). Los experimentos más complicados que tienen dos o más variables independientes, cada una
con varios niveles, también se pueden analizar con la prueba F. Al igual que con rpb, es una correlación
entre las puntuaciones de la variable dependiente y la pertenencia al grupo. Cuanto mayor sea el valor
, lo que
de, mejor podremos predecir la pertenencia al grupo sobre la base de lasignifica
puntuación
un tamaño
de un participante,
del efecto
mayor.
En un análisis de varianza, calculamos el cociente de dos varianzas (esto quedará claro en un
momento), y la significancia está relacionada con dos grados de libertad: uno gl para el numerador (n) y
otro para el denominador (d) de la relación F. Entonces, la fórmula para es:
= (B.14)
df nnd
F df F df / × ( × )+
Las medidas de magnitud del efecto tienen otro uso importante, que también está relacionado con
el hecho de que rechazar la hipótesis nula depende del tamaño de la muestra. Supongamos que
realizamos un experimento y descubrimos que el valor de t no es lo suficientemente grande como para
rechazar la hipótesis nula aunque la diferencia entre las medias no sea cero (es decir, difieren).
Una razón por la que el valor t es pequeño podría ser un tamaño de muestra demasiado pequeño para
detectar una diferencia estadísticamente significativa entre las medias. En este caso, un investigador
prudente calcularía la medida adecuada de la magnitud del efecto, como rpb. Si el coeficiente arroja un
valor moderado o apreciable, entonces sería conveniente aumentar el tamaño de la muestra en el
experimento para rechazar la hipótesis nula. Obtener resultados estadísticamente significativos es
importante, pero en realidad es solo “la mitad de la batalla”. Los resultados significativos que son muy
pequeños no son particularmente emocionantes. Los efectos apreciables que no son estadísticamente
significativos probablemente significan que está en lo cierto y se justifica un aumento en el poder estadístic
Hay otras medidas de la magnitud del efecto, pero no las presentaremos. La lógica es la misma
independientemente de la prueba estadística: las estadísticas inferenciales nos dicen qué tan seguros
podemos estar de que la hipótesis nula es incorrecta. Por otro lado, los coeficientes de correlación,
como rpb, miden la magnitud del efecto de la variable independiente—
el grado en que la hipótesis nula es incorrecta (Thompson & Buchanan, 1979).
El análisis de varianza
La mayor parte de la investigación psicológica ha progresado más allá de la etapa en la que sólo se
comparan entre sí dos condiciones, una experimental y otra de control. En lugar de variar solo la
presencia o ausencia de alguna variable independiente, los investigadores varían sistemáticamente la
magnitud de la variable independiente. En nuestro ejemplo de los efectos del LSD en la velocidad de
carrera de las ratas, puede ser bastante útil variar la cantidad de LSD administrada a las ratas. Quizás
los efectos sean diferentes en dosis bajas que en dosis altas. No pudimos determinar esto a partir del
diseño de dos grupos en el que uno
y que cuando la desviación de las puntuaciones respecto de la media es grande, la varianza será grande.
De manera similar, cuando las desviaciones de la media son pequeñas, la varianza será pequeña.
En el análisis de varianza se obtienen dos estimaciones independientes de la varianza.
Uno se basa en la variabilidad entre los diferentes grupos experimentales: cuánto varían entre sí
las medias de los diferentes grupos. En realidad, la varianza se calcula en cuanto a cuánto difieren
las medias de los grupos individuales de la media general de todas las puntuaciones del
experimento. Cuanto mayor sea la diferencia entre las medias de los grupos, mayor será la
varianza entre grupos.
La otra estimación de la varianza es la varianza dentro de los grupos. Este es el concepto
que ya hemos discutido al considerar las estimaciones de la varianza de muestras individuales;
ahora lo que nos preocupa es encontrar una estimación de la varianza dentro de los grupos que
sea representativa de todos los grupos individuales, por lo que tomamos la media de las varianzas
de estos grupos. La varianza dentro de los grupos nos da una estimación de cuánto difieren entre
sí los sujetos de los grupos (o la media del grupo). En resumen, se obtienen dos estimaciones de
la varianza: una para la varianza dentro de los grupos y otra para la varianza entre grupos. Ahora,
¿de qué sirve esto?
La lógica básica de las pruebas para ver si las puntuaciones de los diferentes grupos o
condiciones son confiablemente diferentes es la siguiente. La hipótesis nula es que todos los
sujetos en las diversas condiciones proceden de la misma población subyacente; la variable
experimental no tiene efecto. Si la hipótesis nula es verdadera y todos los puntajes en los diferentes
grupos provienen de la misma población, entonces la varianza entre grupos debe ser la misma que
la varianza dentro de los grupos. Las medias de los diferentes grupos no deben variar entre sí ni
más ni menos que las puntuaciones dentro de los grupos. Entonces, para que podamos rechazar
la hipótesis nula, las medias de los diferentes grupos deben variar entre sí más de lo que varían
las puntuaciones dentro de los grupos. Cuanto mayor sea la varianza (diferencias) entre los grupos
del experimento, más probable es que la variable independiente haya tenido un efecto,
especialmente si la varianza dentro de los grupos es baja.
Según la lógica que acabamos de esbozar, la razón F bajo la hipótesis nula debería ser 1,00, porque la varianza
entre grupos debería ser la misma que la varianza dentro de los grupos. Cuanto mayor sea la varianza entre
grupos que la varianza dentro de los grupos y, en consecuencia, cuanto mayor sea el cociente F que 1,00, más
confiados podemos estar en rechazar la hipótesis nula. Exactamente cuánto mayor debe ser la relación F que
1,00 depende de los grados de libertad en el experimento o de la libertad de variación de las medidas. Esto
depende tanto del número de grupos o condiciones en el experimento como del número de observaciones en
cada grupo.
Cuanto mayor sea el número de grados de libertad, menor deberá ser el valor de la relación F para que se
considere un efecto significativo, como puede ver al examinar la Tabla F en el Apéndice C. Debe seguir el ejemplo
de cálculo en el Cuadro B.7 cuidadosamente para tener una idea del análisis de la varianza.
Recuadro B.7
Informática Imagine que acaba de realizar un experimento para probar los efectos del LSD en la velocidad de
Análisis de varianza carrera de las ratas, pero administró tres niveles de LSD en lugar de solo dos, como en nuestro
simple ejemplo anterior. Diez ratas no recibieron LSD, otras 10 recibieron una pequeña cantidad y, sin
embargo, un tercer grupo de 10 recibió una gran cantidad.
Por lo tanto, el experimento emplea un diseño entre sujetos, en el que la cantidad de LSD (ninguno,
pequeño, grande) es la variable independiente y el tiempo de ejecución es la variable dependiente.
Primero, calcule la suma de las puntuaciones (X) y la suma de los valores cuadrados de las puntuaciones
(X2 ).
cantidad de LSD
13 17 26
11 15 20
14 dieciséis 29
18 20 31
12 13 17
14 19 25
10 18 26
13 17 23
16 19 25
12 21 27
X 133 175 249
X 13.30 17.50 24.90
X2 1819 3115 6351
continuado
continuado Una cantidad básica en el cálculo del análisis de varianza es la suma de los
cuadrados, que es una forma abreviada del término suma de las desviaciones al cuadrado
de la media. Si revisa la Ecuación B.1, que defi ne la varianza de una muestra, verá que
la suma de los cuadrados es el numerador. En realidad, hay tres sumas de cuadrados de
interés. Primero está la suma total de cuadrados (SS total), que se define como la suma
de las desviaciones al cuadrado de las puntuaciones individuales de la gran media, o la
media de todas las puntuaciones en todos los grupos en el experimento. En segundo lugar
está la suma de cuadrados entre grupos (SS entre), que es la suma de las desviaciones al
cuadrado de las medias de los grupos con respecto a la gran media. En tercer lugar, la
suma de los cuadrados dentro de los grupos (SS dentro de) es la media de la suma de las
desviaciones al cuadrado de las puntuaciones individuales dentro de los grupos o
condiciones de las medias de los grupos. Resulta que SS total lo que
= SSenentre
la práctica
+ SS dentro,
solo sepor
necesita calcular dos sumas de cuadrados; el tercero se puede encontrar por resta.
Estas sumas de cuadrados podrían calcularse tomando las desviaciones de los medios
apropiados, elevándolas al cuadrado y luego encontrando la suma, pero tal método requeriría
mucho tiempo y trabajo. Afortunadamente, las fórmulas computacionales permiten hacer los cálculos
más fácilmente, especialmente si se han encontrado los valores de X y X2 para cada grupo, como en
los datos presentes. La fórmula para encontrar la suma total de cuadrados es
2
2 T
SStotal = ÿÿ ÿ X (B.17)
norte
donde X2 significa que cada puntuación dentro de cada grupo está elevada al cuadrado (X2 ) y
todos estos valores elevados al cuadrado se suman, por lo que. X2
Hay dos signos de suma separados,
uno para sumar los valores cuadrados dentro de los grupos y otro para luego sumar estos X2 en
los diferentes grupos. La T es para el total de todos los puntajes; N aquí es el número total de
puntuaciones en el experimento. Entonces SStotal en nuestro ejemplo se calcula de la siguiente
manera:
2
2 T
SS = X ÿ
totales
norte
2
( 133++)175 249
SS totales
1819 3115 6351 =++ÿ
30
310 249
,
SStotal = 11 ,285 ÿ
30
SStoda = 11 ,285
yo
,. 10 341 63 ÿ
SStotal = 943 37
.
2 2
X T (B.18)
SSentre = ÿ(ÿ ) ÿ
norte norte
continuado
continuado La primera parte de la fórmula significa que la suma de los valores de cada grupo se eleva al
cuadrado y luego se divide por el número de observaciones en las que se basa, o (X)
2 2
/ norte; luego, estos valores se suman entre los grupos, por lo que (X) / norte. los
La segunda parte de la fórmula es la misma que para el total de SS :
2 2
X T
= ÿ(ÿ )
SS entre
ÿ
norte norte
= 689 87
.
SS entre
La suma de los cuadrados dentro de los grupos se puede encontrar restando SS entre del total de
compararlo directamente
SS , = 943.37. Esto
– 689.87
se hace
= 253.50
calculando
Pero como
un total
verificación,
SS , comotambién
en la Ecuación
vale la pena
B.16, para
cada grupo y sumando todas estas sumas de cuadrados para los grupos individuales. A menos que
haya cometido un error, esta cantidad debe ser igual a SS dentro de lo obtenido por resta.
Como ya se discutió en el texto, estos dos valores se comparan calculando una relación F ,
que se encuentra dividiendo el MS entre el MS dentro. Una vez que se calcula el valor de F , es
necesario determinar si el valor alcanza un nivel aceptable de significación estadística. Al observar
la Tabla F en el Apéndice C, podemos ver que para 2 y 26 grados de libertad (lo más cercano
que podemos llegar a 2 y 27), se necesita un valor F de 9.12 para el nivel de significancia de .001.
Nuestro valor F supera los 9,12, por lo que podemos concluir que los grupos variaron de forma
fiable en la velocidad de carrera debido a la variación de la variable independiente, la cantidad de
LSD inyectada.
continuado
continuado
Fuente d.f. SS EM F pags
Nota: Si calcula análisis de varianza con la ayuda de una calculadora, debe protegerse contra errores. Si alguna vez se te ocurre un
suma negativa de cuadrados dentro de los grupos (restando SSentre de SStotal), sabrá que ha cometido un error. No puedes
tienen una suma de cuadrados negativa. Debe calcular SSwithin tanto por resta como directamente, de todos modos, como verificación. Un error
común es confundir X2 (cuadrar cada número y luego sumar los cuadrados) con (X ) 2 , que es el cuadrado del total (X) de las puntuaciones.
Si el simple análisis de varianza indica que existe una variación confiable entre las condiciones de
un experimento, esto todavía no nos dice todo lo que nos gustaría saber.
En particular, sigue siendo de gran interés saber cuáles de las condiciones individuales varían entre sí.
Esto es especialmente importante en los casos en que la manipulación de variables independientes es
de naturaleza cualitativa. La variación cuantitativa de una variable independiente se refiere al caso
en el que se manipula la cantidad de una variable independiente (por ejemplo, la cantidad de LSD),
mientras que con la variación cualitativa, las condiciones varían pero no de una manera cuantitativa
fácil de especificar.
Un ejemplo de variación cualitativa es una manipulación instruccional en la que las diferentes
condiciones varían en las instrucciones que se dan al inicio del experimento. En tales casos, no es
suficiente simplemente decir que las condiciones varían de manera confiable entre sí. Es de interés
saber qué condiciones particulares difieren. Para responder a esta pregunta, necesitamos realizar
pruebas, después del simple análisis de varianza. En estas pruebas de seguimiento, las condiciones de
los experimentos se toman de dos en dos y se comparan para que podamos ver qué pares son
diferentes de manera confiable.
Se puede utilizar una gran variedad de pruebas estadísticas para este propósito. Podríamos realizar
análisis de varianza sobre grupos tomados como pares, lo que equivale a realizar pruebas t , pero
normalmente se realizan otras pruebas. Estos incluyen la prueba de Newman-Keuls, la prueba de
Scheffé, la prueba de rangos múltiples de Duncan, la prueba HSD (Diferencias honestamente
significativas) de Tukey y la prueba de Dunnett. Estos varían en sus suposiciones y su poder.
Debe consultar los textos estadísticos cuando necesite utilizar una prueba de seguimiento.
Cuando realizamos un análisis de varianza complejo, descubrimos los efectos separados de cada factor en el
experimento (llamados efectos principales) y cómo las variables se afectan entre sí (llamados efectos de
interacción, o simplemente interacciones). Si las mujeres tendieran a estar más cerca del confederado que los
hombres, independientemente del sexo del confederado, esto sería un efecto principal del sexo del sujeto en la
distancia interpersonal. Y, nuevamente, una interacción sería el efecto diferente del sexo del sujeto, dependiendo del
sexo del cómplice.
No podemos dedicar espacio a explicar completamente cómo se realizan estos complejos análisis de varianza.
Brevemente, la SS intermedia se encuentra tal como está en el análisis de varianza simple o unidireccional, pero se
descompone en los efectos principales de las variables independientes y sus interacciones. Luego, los cuadrados
medios se calculan sobre la base de estas sumas de cuadrados dividiendo por el número apropiado de grados de
libertad, y F
Las proporciones se obtienen como antes. En el Cuadro B.8 se muestra un ejemplo.
El análisis de varianza es una prueba estadística paramétrica; por lo tanto, se incorporan supuestos en la
prueba sobre los parámetros de población que subyacen a las muestras. Los dos supuestos más importantes en el
tipo de análisis de varianza que estamos considerando (el modelo de efectos fijos) establecen que las observaciones
en cada condición se distribuyen normalmente y
Recuadro B.8
Cálculo de un Este experimento tuvo 40 sujetos. Se dividieron en cuatro grupos de 10, cada grupo representando
2 2 ANOVA una condición diferente. A dos grupos se les dieron palabras de alta imaginería para aprender, o
sobre los datos palabras que se refieren a objetos concretos que se visualizan fácilmente (por ejemplo, elefante, silla,
de una memoria automóvil). Los otros dos grupos recibieron palabras de baja imaginería, o que son abstractas y de las
Experimento que es difícil formar imágenes (como belleza, democracia, verdad). Los dos grupos que recibieron cada
tipo de palabra difirieron en las instrucciones de aprendizaje que recibieron. Se le dijo a un grupo de sujetos
en cada una de las dos condiciones de imágenes que repitieran cada palabra hasta que vieran aparecer la
siguiente palabra en la pantalla. Estos sujetos estaban en la condición de ensayo de memoria. Se instruyó
a los sujetos en la condición de ensayo elaborativo para que crearan imágenes mentales o asociaciones
significativas entre las palabras a medida que las aprendían. Por lo tanto, el experimento representa un
diseño factorial 2 2, siendo un factor el tipo de material estudiado (palabras con imágenes altas o bajas) y
el otro las instrucciones que se dieron a los sujetos (instrucciones de ensayo de elaboración o de memoria).
El diseño es entre sujetos, ya que en cada una de las cuatro condiciones participó un grupo diferente de
sujetos. El número de palabras recordadas por cada sujeto aparece en la siguiente tabla. Luego se detallan
los pasos involucrados en el análisis de varianza, que nos permiten analizar adecuadamente los resultados
del experimento.
continuado
continuado
Palabras de alta imaginería Palabras con pocas imágenes
5 8 4 7
7 8 1 6
6 9 5 3
4 7 6 3
4 10 4 5
9 10 3 6
7 8 4 2
5 9 4 4
5 8 5 5
6 3 4
X58 _ 9 86 39 45
X 5,8 8.6 3.9 4.5
X2 358 X2 748 169 225
Paso 1: Elevar al cuadrado la gran suma (X = 228) y dividir por el número total de
2
puntuaciones (40): (X) / N = (288)2 /40 = 1299,6 Este es el término de corrección.
2
Paso 2: SS Total = X2 – (X) / NORTE. Reste los resultados del Paso 1 de 1500:
1500 – 1299,6=200,4.
Paso 3: Imágenes SS. Obtenga la suma de todos los puntajes en cada condición de imágenes, eleve al
cuadrado cada suma, luego divida cada suma por el número de puntajes que arrojan cada suma, sume
los dos cocientes y luego reste los resultados del Paso 1 de la última suma.
Paso 1
2 2
1 44 84+
= ÿ
1299 6.
20
= 1389 6. 1299 6 ÿ
= 90
Paso 4: Ensayo SS . Esto se calcula de la misma manera que el Paso 3, excepto que basa sus
cálculos en la suma total de cada tipo de ensayo.
2 2
( 86
+ ) 45
+( 58
+ ) 39
Ensayo SS = ÿ
Paso 1
20
= 132 8 .5 1299 6 . ÿ
= 28 9.
Paso 5: Ensayo de imágenes SS. Cuadre la suma de cada grupo y sume los cuadrados. continuado
continuado Luego divida cada suma por el número de puntajes en cada suma. Del último
resultado, reste el Paso 1, las Imágenes SS (Paso 3) y el Ensayo SS (Paso 4).
2222
+++
58 86 39 45
ISQ R × =
20
ÿÿÿ
= 14306 /.10
. 1299 6 90 28 9
ÿ ÿÿ
= 12 .1
Paso 8: Cuadro resumen. Calcule los cuadrados medios (MS) dividiendo SS por el número
de df. Luego calcule las proporciones F dividiendo el tratamiento MS por el error MS .
2
Prueba de Independencia
La tabla B.8 muestra datos como los de la tabla 2.1, que ilustra las frecuencias con las que hombres y mujeres
seleccionaron carreras en cinco departamentos en una universidad pequeña. La hipótesis nula sostiene que
la elección de la carrera es independiente del sexo de una persona (no depende de él). Si las dos variables
son independientes, deberíamos ver frecuencias relativas aproximadamente equivalentes en cada una de las
celdas de la tabla B.8. Sin embargo, las frecuencias son diferentes y podemos usar la prueba de
2
independencia de chi-cuadrado ( ) para determinar si el sexo está relacionado con la elección de la carrera.
2 es como sigue:
La fórmula para determinar
2 2/ Y
(TÚ ) (B.19)
donde O se refiere a las frecuencias observadas (las que se muestran en cada celda de la Tabla B.8), 2
y E se refiere a las frecuencias esperadas para cada celda. Como se muestra en el Recuadro B.9, donde se
calcula, las frecuencias esperadas se calculan multiplicando el total de fila y columna para una celda en
particular y luego dividiendo ese multiplicando por el número total de frecuencias en la tabla. Entonces, para
las mujeres que seleccionan una especialidad en historia, las frecuencias esperadas serían (154 115)/378, lo
que equivale a 46,85. El cálculo completo se muestra en el Recuadro B.9.
ÿ TABLA B.8
Una tabla de contingencia de 2 5 que muestra las frecuencias con las que
hombres y mujeres seleccionaron carreras en cinco departamentos en una
universidad pequeña. Las frecuencias relativas (%) de hombres y mujeres en
cada especialidad se muestran entre paréntesis.
programa principal
Paso 2: reste las frecuencias esperadas de las observadas, eleve al cuadrado cada diferencia y
divida esa diferencia por la frecuencia esperada para esa celda.
Las estadísticas se utilizan con tanta frecuencia que parece posible reforzar cualquier discusión con ellas.
Son empleados por políticos, economistas, publicistas, psicólogos y muchos otros para apoyar diversos
puntos de vista, por lo que no es de extrañar que la gente haya tenido la impresión de que las estadísticas
pueden manipularse para cualquier propósito. Pero el adagio dice que "las estadísticas no mienten, los
estadísticos sí". En realidad, probablemente haya poco que temer de los propios estadísticos, porque su
sofisticación les permite diferenciar un argumento verdadero de uno falso basado en estadísticas. No obstante,
las estadísticas pueden ser mal utilizadas para crear una impresión falsa. Debe tener en cuenta algunos usos
indebidos comunes, para que no se deje engañar por ellos.
Muchos comerciales de televisión nos engañan implícitamente con muestras pequeñas o sesgadas.
Los espectadores ven a una mujer a la que se le pide que pruebe dos marcas de detergente en la ropa
grasosa y manchada de hierba de su familia. Ella está enfrentando su producto habitual, BAF, contra
el nuevo Super Crud Remover (SCR). BAF entra en una lavadora, SCR entra en la otra, y luego se
muestra a la mujer exclamando por el mejor trabajo que hizo SCR. Locutor: "¿Estás convencido?"
Mujer: “Pues, sí. Siempre usaré Super Crud Remover de ahora en adelante.
Realmente quita la mugre de mi ropa”. Incluso haciendo la improbable suposición de que toda la
demostración no fue amañada, los observadores deberían saber mejor que no dejarse convencer por
una muestra tan pequeña (un caso). Si el “experimento” se repitiera honestamente con cien
consumidores, ¿eligirían todos ellos SCR? El anunciante trata de dejarnos con la impresión de que
debido a que esta mujer prefiere el producto, todos (la población) lo harán. Pero debemos tener cuidado
al asumir que algo es cierto de la población en general a partir de una muestra de uno.
Otro problema es que una muestra de personas encuestadas para un anuncio de este tipo podría
estar sesgada deliberadamente. Los anunciantes siempre están encuestando a grupos que
probablemente estén predispuestos a su favor de todos modos, como las personas que ya poseen el
producto. Los anunciantes preguntan a los consumidores: "¿Qué tan bien le gusta su Bass-o-matic?" y
luego mostrar una pequeña muestra de entrevistas que salieron bien desde el punto de vista del
fabricante. Sería más convincente tomar muestras de personas que nunca habían usado el producto y
probar el producto contra sus principales rivales. Dado que ahora más afirmaciones publicitarias en
televisión deben basarse en hechos, este tipo de comerciales se está utilizando cada vez más. En un
anuncio interesante, se pide a los propietarios de un tipo de automóvil de lujo que lo prueben contra un
automóvil de la competencia. Aquí hay un caso en el que se espera que la muestra analizada esté
sesgada contra el nuevo producto a favor del antiguo, por lo que si se encuentra una preferencia por el
nuevo producto, parece argumentar mucho más a favor del nuevo producto.
Cada vez que escuche acerca de las preferencias que han exhibido las personas, haga dos
preguntas sobre la muestra: (1) ¿Qué tan grande era? (2) ¿Cómo se eligió a las personas para estar en él?
El gráfico exagerado Una forma común de mostrar u ocultar diferencias en los gráficos es
exagerar los resultados que se grafican. Esto implica cambiar la escala en el gráfico para mostrar una
diferencia o (más raramente) para ocultar una diferencia. Suponga que el número de asesinatos en
una ciudad aumentó de 72 a 80 a 91 durante tres años. El próximo año, la alcaldesa se postula para la
reelección y está ansiosa por demostrar que la ciudad ha estado segura durante los últimos tres años
bajo su administración. Entonces, los trabajadores de su campaña dibujan el gráfico que se muestra
en el lado izquierdo de la Figura B.5. Al hacer que la escala en el eje Y sea muy larga, crean la
impresión de que la tasa de homicidios es bastante estable. En el mismo año, la policía de la ciudad
argumenta que necesita niveles más altos de personal. Quieren mostrar que la ciudad se está volviendo
más insegura, por lo que muestran que la tasa de homicidios aumenta abruptamente al cambiar la
escala, como en el gráfico de la derecha de la figura B.5.
Los hechos se muestran con precisión en ambos grupos. Sin embargo, el gráfico de la izquierda
da la impresión de que la tasa de homicidios está aumentando muy gradualmente, por lo que no vale
la pena preocuparse. (¿No ha hecho el alcalde un buen trabajo al frente de la ciudad?) El gráfico de la
derecha, por otro lado, crea la impresión de que la tasa de homicidios está aumentando drásticamente.
(¿No necesitamos más policías?)
Estas técnicas gráficas son comunes. De hecho, se utilizan escalas exageradas en algunos de
los gráficos de este libro para mostrar patrones de resultados más claramente. Debería
200 90
160
asesinatos
Número
de
120 asesinatos
Número
de
80
80
40 70
0
2000 2001 2002 2000 2001 2002
Años Años
ÿ FIGURA B.5
Variación en escalas. El gráfico de la izquierda parece mostrar que la tasa de homicidios está
aumentando solo levemente, mientras que el de la derecha muestra que la tasa aumenta drásticamente.
Sin embargo, ambos gráficos muestran la tasa de homicidios con precisión: la diferencia es la escala en
el eje Y. Es importante examinar un gráfico con cuidado y anotar la escala de medida, ya que los
cambios de escala pueden hacer que las pequeñas diferencias parezcan grandes y viceversa.
siempre mire cuidadosamente la escala en un gráfico. Con datos experimentales, es más importante
determinar si una diferencia es estadísticamente confiable que determinar si la diferencia parece grande
cuando se grafica.
ÿ RESUMEN
1. La comprensión de algunos principios elementales sobre control, difieren entre sí, usamos la prueba t o la prueba U de
estadística es crucial para la realización de investigaciones Mann-Whitney , que se aplican cuando se emplean dos
psicológicas. Hay dos ramas de la estadística, descriptiva e grupos independientes de sujetos, y la prueba de signos, la
inferencial. prueba t y la prueba de rangos con signo de Wilcoxon, que
2. Las estadísticas descriptivas se utilizan para resumir y se aplican cuando las medidas en las dos condiciones están
organizar datos sin procesar. Existen métodos gráficos para relacionadas (ya sea mediante el uso de un diseño dentro de
hacerlo, como histogramas y polígonos de frecuencia. Sin los sujetos o mediante el emparejamiento de sujetos). Las
embargo, las medidas de resumen primarias son las de pruebas de Mann-Whitney y Wilcoxon son pruebas estadísticas
tendencia central de una distribución y dispersión de una no paramétricas, ya que no hacen suposiciones acerca de
distribución. los parámetros de la población que subyacen a las
3. La principal medida de tendencia central es la media de la observaciones de la muestra que en realidad se utilizan. Para
distribución, o lo que suele llamarse el promedio de las determinar qué tan equivocada está la hipótesis nula, se
puntuaciones. A veces se utiliza la mediana (la puntuación calcula una medida de la magnitud del efecto de la variable
más media), especialmente para distribuciones con independiente. Esta medida suele adoptar la forma de un
puntuaciones extremas. Las principales medidas de dispersión coeficiente de correlación. un considerable
son la desviación estándar y la varianza. La desviación la magnitud del efecto sin significación estadística sugiere
estándar se utiliza más de que puede ser necesario un tamaño de muestra más grande
diez en estadística descriptiva, y la varianza se usa para rechazar la hipótesis nula.
principalmente en estadística inferencial. Se supone que la 6. El análisis de varianza es el procedimiento estadístico
mayoría de las distribuciones en psicología son normales, lo importante que se usa para hacer comparaciones entre más
que significa que la media y la mediana caen en el mismo de dos grupos. El análisis de varianza simple se usa para
lugar; que la distribución sea simétrica; y que una cierta probar la confiabilidad cuando se manipula una variable
proporción de puntajes cae bajo cada parte de la curva normal. independiente. Los análisis multifactoriales más complicados
se utilizan cuando dos o más variables independientes se
4. La estadística inferencial nos permite hacer inferencias manipulan simultáneamente. Estos diseños multifactoriales
sobre la fiabilidad de las diferencias entre condiciones. son especialmente importantes porque nos permiten evaluar
Queremos inferir de una muestra de puntajes cuál es el caso la interacción de los factores que determinan el comportamiento
para las poblaciones involucradas. En la estadística inferencial
se utiliza una gran variedad de pruebas. En todos se aplica
una lógica similar. Se prueba una hipótesis alternativa contra 7. Disraeli dijo que “hay tres tipos de mentiras: mentiras, malditas
la hipótesis nula, que sostiene que no hay diferencias entre mentiras y estadísticas”. Algunas formas en las que las
los grupos en el experimento. Se realizan cálculos que dan estadísticas pueden ser mal utilizadas incluyen sacar
lugar a un valor. Luego, este valor se compara con una conclusiones de muestras pequeñas o sesgadas; exagerar
distribución de valores en una tabla que nos informa qué nivel las escalas en los gráficos para efectos; hacer comparaciones
de confianza podemos inapropiadas; y suponiendo que las leyes de probabilidad que
se cumplen para muestras enormes de observaciones pueden
tienen al rechazar la hipótesis nula. generalizarse a muestras pequeñas (como en la falacia del
5. Usamos una prueba de puntaje z para comparar una muestra jugador). Las estadísticas en sí mismas no mienten, pero
con una población conocida para ver si la muestra proviene pueden usarse para dar impresiones engañosas.
de la misma población. Para determinar si dos grupos, uno
experimental y otro
prueba f prueba
distribuciones de frecuencia de signos
polígonos de frecuencia de muestra análisis simple de
histogramas homogeneidad varianza desviación estándar error
de varianza estadística estándar de las puntuaciones
inferencial punto de inflexión estándar medias
efectos de interacción nivel de Estadísticas
confianza magnitud del efecto prueba t
error tipo I
error tipo II
Prueba U de Mann-Whitney varianza
mediana análisis Prueba de rangos con signo de
multifactorial de varianza prueba no Wilcoxon Varianza dentro de los grupos
direccional puntuaciones z
pruebas no parametricas
CONEXIONES WEB
Explore la presentación paso a paso de:
Tendencia Central y Variabilidad
Puntuaciones Z
Error estándar
Prueba de hipótesis
Correlación
http://academic.cengage.com/psychology/workshops
Puede encontrar un libro completo de estadísticas con un paquete de análisis y demostración en:
http://www.ruf.rice.edu/~lane/rvls.html
Este sitio contiene programas de análisis estadístico para casi cualquier problema estadístico aplicado:
http://members.aol.com/johnp71/javastat.html
APÉNDICE C
ESTADÍSTICO
MESAS
TABLA A
Proporciones del área bajo la curva normal
TABLA B
Valores críticos del estadístico U de la prueba de Mann-Whitney
TABLA C
Distribución para la Prueba de Signos
TABLA D
Valores críticos del estadístico T de Wilcoxon para los pares emparejados
TABLA E
Valores críticos de t
TABLA F
Valores críticos de la distribución F
TABLA G
2
Valores Críticos de la Distribución
TABLA H
Números al azar
La columna A da la z positiva
puntaje.
Significar Con
Continuado
Continuado
de la columna siguiente.
Continúa en la parte superior
de la página siguiente.
de la columna siguiente.
Continuado
ÿ TABLA B
(a) Valores críticos de U para una prueba de una cola en .001 o para una prueba de dos colas en .002
n1/n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1
2
0 0 0 0
34 0 0 0 1 1 1 2 2 3 3
5 1 1 2 2 3 4 5 5 36 7 7
6 2 3 4 4 5 36 7 8 9 10 11 12
7 3 5 6 7 8 9 10 11 13 14 15 dieciséis
8 5 6 8 9 11 12 14 15 17 18 20 21
9 7 8 10 12 14 15 17 19 21 23 25 26
10 8 10 12 14 17 19 21 23 25 27 29 32
11 10 12 15 17 20 22 24 27 29 32 34 37
12 12 14 17 20 23 25 28 31 34 37 40 42
13 14 17 20 23 26 29 32 35 38 42 45 48
14 15 19 22 25 29 32 36 39 43 46 50 54
15 17 21 24 28 32 36 40 43 47 51 55 59
dieciséis 19 23 27 31 35 39 43 48 52 56 60 sesenta y cinco
17 21 25 29 34 38 43 47 52 57 61 66 70
18 23 27 32 37 42 46 51 56 61 66 71 76
19 25 29 34 40 45 50 55 60 66 71 77 82
20 26 32 37 42 48 54 59 65 70 76 82 88
Continuado
Continuado
(b) Valores críticos de U para una prueba de una cola en .01 o para una prueba de dos colas en .02
n1 n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1
2 00000 0 1 1
3 111222334 4 5 9 9 4 5
4 3 3 4 5 6 7 7 8 9 10
5 5 6 7 8 10 11 12 13 14 15 dieciséis
6 7 8 9 11 12 13 15 dieciséis 18 19 20 22
7 9 11 12 14 dieciséis 17 19 21 23 24 26 28
8 11 13 15 17 20 22 24 26 28 30 32 34
9 14 dieciséis 18 21 23 26 28 31 33 36 38 40
10 dieciséis 19 22 24 27 30 33 36 38 41 44 47
11 18 22 25 28 31 34 37 41 44 47 50 53
12 21 24 28 31 35 38 42 46 49 53 56 60
13 23 27 31 35 39 43 47 51 55 59 63 67
14 26 30 34 38 43 47 51 56 60 65 69 73
15 28 33 37 42 47 51 56 61 66 70 75 80
dieciséis 31 36 41 46 51 56 61 66 71 76 82 87
17 33 38 44 49 55 60 66 71 77 82 88 93
18 36 41 47 53 59 65 70 76 82 88 94 100
19 38 44 50 56 63 69 75 82 88 94 101 107
20 40 47 53 60 67 73 80 87 93 100 107 114
(c) Valores críticos de U para una prueba de una cola en .025 o para una prueba de dos colas en .05
n1 n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1
2 001111 1 1 2 2 2 2
3 233445 5 6 6 7 7 8
4 4 5 6 7 8 9 10 11 11 12 13 13
5 7 8 9 11 12 13 14 15 17 18 19 20
6 10 11 13 14 dieciséis 17 19 21 22 24 25 27
7 12 14 dieciséis 18 20 22 24 26 28 30 32 34
8 15 17 19 22 24 26 29 31 34 36 38 41
9 17 20 23 26 28 31 34 37 39 42 45 48
10 20 23 26 29 33 36 39 42 45 48 52 55
11 23 26 30 33 37 40 44 47 51 55 58 62
12 26 29 33 37 41 45 49 53 57 61 sesenta y cinco 69
13 28 33 37 41 45 50 54 59 63 67 72 76
14 31 36 40 45 50 55 59 64 67 74 78 83
15 34 39 44 49 54 59 64 70 75 80 85 90
dieciséis 37 42 47 53 59 64 70 75 81 86 92 98
17 39 45 51 57 63 67 75 81 87 93 99 105
18 42 48 55 61 67 74 80 86 93 99 106 112
Continuado
Continuado
(d) Valores críticos de U para una prueba de una cola en .05 o para una prueba de dos colas en .10
n1 n2 9 10 11 12 13 14 15 dieciséis 17 18 19 20
1 0 0
2 1112 2 2 3 4 4 4
3 3 4 5 6 7 37 8 3 9 10 11
4 6 7 8 5 10 11 12 14 9 15 dieciséis 17 18
5 9 11 12 9 15 dieciséis 18 19 20 22 23 25
6 12 14 dieciséis 13 17 19 21 23 25 26 28 30 32
7 15 17 19 21 24 26 28 30 33 35 37 39
8 18 20 23 26 28 31 33 36 39 41 44 47
9 21 24 27 30 33 36 39 42 45 48 51 54
10 24 27 31 34 37 41 44 48 51 55 58 62
11 27 31 34 38 42 46 50 54 57 61 65 69
12 30 34 38 42 47 51 55 60 64 68 72 77
13 33 37 42 47 51 56 61 65 70 75 80 84
14 36 41 46 51 56 61 66 71 77 82 87 92
15 39 44 50 55 61 66 72 77 83 88 94 100
dieciséis 42 48 54 60 65 71 77 83 89 95 101 107
17 45 51 57 64 70 77 83 89 96 102 109 115
18 48 55 61 68 75 82 88 95 102 109 116 123
19 51 58 65 72 80 87 94 101 109 116 123 130
20 54 62 69 77 84 92 100 107 115 123 130 138
Fuente: Adaptado con autorización de “Extended Tables for the Mann-Whitney Statistic”, de D. Aube, 1953, Bulletin of the Institute of Educational
Investigación en la Universidad de Indiana 1, No. 2, Tablas 1, 3, 5 y 7. Tomado de Estadísticas no paramétricas para las ciencias del comportamiento, por S. Siegel, 1956,
Valores críticos de t
Para encontrar el valor apropiado de t, lea la fila que contiene el número
de grados de libertad en su experimento. Las columnas están determinadas
por el nivel de significancia que ha elegido, y las entradas de las celdas son
los valores críticos para cada df en cada nivel de probabilidad. El valor de t
que obtenga debe ser igual o mayor que el de la tabla para que sea
significativo. Por ejemplo, con df 15 y p .05 (prueba de dos colas), su t debe
ser mayor o igual a 2.131.
Continuado
Continuado
Fuente: la tabla E se tomó de "Tablas extendidas de los puntos porcentuales de la distribución t de Student", de ET Federighi, 1959, Journal of the American
Asociación Estadística, 54, 683–688. Se reproduce con permiso de la Asociación Estadounidense de Estadística. Reservados todos los derechos.
ÿ TABLA F
df para numerador
para _
Denominador 1 2 345678 9
.25 2.02 2.28 2.36 2,39 2.41 2.42 2.43 2.44 2.44
.10 5.54 5.46 5.39 5,34 5.31 5.28 5.27 5.25 5.24
3 .05 10.1 9,55 9,28 9.12 9,01 8,94 8,89 8.85 8.81
.025 17.4 16,0 15,4 15.1 14,9 14,7 14,6 14.5 14.5
.01 34.1 30.8 29.5 28.7 28.2 27,9 27.7 27.5 27.4
.001 167 148 141 137 135 133 132 131 130
.25 1.81 2.00 2.05 2.06 2.07 2.08 2.08 2.08 2.08
.10 4.54 4,32 4,19 4.11 4.05 4.01 3,98 3,95 3.94
4 .05 7.71 6,94 6,59 6,39 6.26 6.16 6,09 6,04 6.00
.025 12.2 10,6 9,98 9,60 9.36 9.20 9.07 8,98 8.90
.01 21.2 18.0 16,7 16,0 15.5 15.2 15.0 14,8 14.7
.001 74.1 61.2 56.2 53.4 51.7 50.5 49.7 49.0 48.5
.25 1,69 1.85 1.88 1.89 1,89 1,89 1.89 1,89 1.89
.10 4,06 3.78 3,62 3.52 3,45 3,40 3,37 3,34 3.32
5 .05 6.61 5,79 5,41 5.19 5.05 4,95 4,88 4,82 4.77
.025 10.0 8,43 7.76 7,39 7.15 6,98 6.85 6.76 6.68
.01 16,3 13.3 12.1 11,4 11.0 10.7 10.5 10,3 10.2
.001 47,2 37.1 33.2 31.1 29.8 28.8 28.2 27,6 27.2
Continuado
Continuado
df para numerador
para _
Denominador 1 2 345678 9
.25 1.62 1,76 1.78 1.79 1.79 1.78 1.78 1.78 1.77
.10 3.78 3,46 3,29 3.18 3.11 3.05 3.01 2.98 2.96
6 .05 5.99 5.14 4,76 4,53 4.39 4.28 4.21 4,15 4.10
.025 8.81 7.26 6,60 6,23 5.99 5.82 5,70 5,60 5.52
.01 13.8 10.9 9.78 9.15 8.75 8.47 8,26 8.10 7.98
.001 35.5 27,0 23.7 21,9 20.8 20.0 19.5 19.0 18.7
.25 1.57 1,70 1.72 1,72 1.71 1.71 1.70 1.70 1.69
.10 3.59 3,26 3.07 2,96 2.88 2.83 2.78 2.75 2.72
7 .05 5.59 4,74 4.35 4.12 3.97 3.87 3.79 3.73 3.68
.025 8.07 6,54 5.89 5.52 5,29 5.12 4,99 4,90 4.82
.01 12.2 9.55 8.45 7.85 7,46 7.19 6,99 6,84 6.72
.001 29.2 21.7 18.8 17.2 16,2 15.5 15.0 14.6 14.3
.25 1,54 1.66 1.67 1.66 1.66 1,65 1.64 1.64 1.63
.10 3,46 3.11 2.92 2.81 2,73 2,67 2.62 2.59 2.56
8 .05 5.32 4.46 4.07 3.84 3,69 3,58 3.50 3.44 3.39
.025 7.57 6.06 5.42 5.05 4.82 4,65 4,53 4,43 4.36
.01 11.3 8.65 7.59 7.01 6.63 6,37 6,18 6,03 5.91
.001 25.4 18.5 15.8 14.4 13.5 12.9 12.4 12.0 11.8
.25 1,51 1.62 1.63 1,63 1.62 1.61 1.60 1.60 1.59
.10 3,36 3.01 2.81 2,69 2.61 2.55 2.51 2.47 2.44
9 .05 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18
.025 7.21 5.71 5,08 4.72 4.48 4.32 4.20 4.10 4.03
.01 10.6 8.02 6,99 6.42 6.06 5.80 5.61 5.47 5.35
.001 22,9 16.4 13.9 12.6 11.7 11.1 10.7 10.4 10.1
.25 1.49 1.60 1.60 1,59 1.59 1,58 1.57 1.56 1.56
.10 3,29 2.92 2.73 2,61 2.52 2,46 2.41 2.38 2.35
10 .05 4,96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02
.025 6,94 5,46 4,83 4.47 4.24 4.07 3.95 3,85 3.78
.01 10.0 7,56 6,55 5.99 5.64 5.39 5.20 5,06 4.94
.001 21.0 14.9 12,6 11.3 10.5 9.92 9.52 9.20 8.96
.25 1.47 1,58 1,58 1.57 1.56 1.55 1.54 1.53 1.53
.10 3.23 2,86 2,66 2.54 2.45 2.39 2.34 2.30 2.27
.05 4.84 3,98 3,59 3.36 3.20 3.09 3,01 2,95 2.90
11 .025 6.72 5,26 4,63 4.28 4.04 3.88 3,76 3,66 3.59
.01 9.65 7.21 6,22 5.67 5.32 5.07 4,89 4.74 4.63
.001 19.7 13.8 11.6 10.4 9.58 9.05 8,66 8.35 8.12
.25 1.46 1.56 1.56 1.55 1.54 1.53 1.52 1.51 1.51
.10 3.18 2.81 2.61 2.48 2.39 2.33 2.28 2.24 2.21
.05 4.75 3.89 3.49 3.26 3.11 3.00 2,91 2.85 2.80
12 .025 6.55 5.10 4.47 4.12 3,89 3.73 3,61 3.51 3.44
.01 9,33 6.93 5.95 5.41 5,06 4.82 4,64 4.50 4.39
.001 18,6 13.0 10.8 9.63 8.89 8.38 8.00 7.71 7.48
.25 1.45 1.55 1.55 1.53 1.52 1.51 1.50 1.49 1.49
.10 3,14 2.76 2.56 2.43 2.35 2.28 2.23 2.20 2.16
.05 4,67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71
Continuado
Continuado
df para numerador
para _
Denominador 1 2 345678 9
13 .025 6.41 4,97 4.35 4.00 3,77 3,60 3.48 3.39 3.31
.01 9.07 6,70 5.74 5.21 4,86 4,62 4.44 4.30 4.19
.001 17.8 12.3 10.2 9.07 8.35 7.86 7.49 7.21 6.98
.25 1.44 1.53 1.53 1.52 1.51 1.50 1.49 1.48 1.47
.10 3,10 2.73 2.52 2.39 2,31 2.24 2,19 2.15 2.12
.05 4,60 3,74 3.34 3.11 2,96 2.85 2,76 2.70 2.65
14 .025 6,30 4,86 4.24 3.89 3,66 3,50 3.38 3.29 3.21
.01 8,86 6.51 5.56 5,04 4,69 4,46 4.28 4.14 4.03
.001 17.1 11.8 9.73 8,62 7.92 7.43 7.08 6.80 6.58
.25 1.43 1.52 1.52 1,51 1.49 1.48 1,47 1.46 1.46
.10 3.07 2,70 2.49 2,36 2.27 2.21 2,16 2.12 2.09
.05 4,54 3,68 3.29 3,06 2.90 2.79 2.71 2.64 2.59
15 .025 6,20 4,77 4.15 3.80 3,58 3.41 3.29 3.20 3.12
.01 8.68 6,36 5.42 4.89 4,56 4.32 4.14 4.00 3.89
.001 16.6 11.3 9.34 8.25 7.57 7.09 6.74 6.47 6.26
.25 1.42 1,51 1,51 1.50 1.48 1.47 1.46 1.45 1.44
.10 3.05 2,67 2,46 2.33 2.24 2.18 2,13 2.09 2.06
.05 4,49 3,63 3.24 3.01 2.85 2.74 2,66 2.59 2.54
dieciséis .025 6,12 4,69 4.08 3.73 3.50 3.34 3.22 3.12 3.05
.01 8,53 6,23 5.29 4.77 4.44 4.20 4,03 3,89 3.78
.001 16,1 11.00 9.00 7.94 7.27 6.81 6,46 6,19 5.98
.25 1.42 1,51 1.50 1.49 1.47 1.46 1.45 1.44 1.43
.10 3.03 2,64 2.44 2,31 2.22 2.15 2.10 2.06 2.03
.05 4,45 3,59 3.20 2,96 2.81 2.70 2.61 2,55 2.49
17 .025 6,04 4,62 4.01 3,66 3.44 3.28 3.16 3,06 2.98
.01 8.40 6.11 5.18 4,67 4.34 4.10 3,93 3,79 3.68
.001 15.7 10.7 8.73 7,68 7.02 6.56 6,22 5,96 5.75
.25 1.41 1,50 1.49 1.48 1.46 1.45 1.44 1.43 1.42
.10 3.01 2,62 2.42 2.29 2.20 2,13 2.08 2.04 2.00
.05 4.41 3,55 3.16 2,93 2.77 2,66 2.58 2.51 2.46
18 .025 5.98 4,56 3.95 3,61 3.38 3.22 3.10 3.01 2.93
.01 8.29 6,01 5.09 4,58 4,25 4.01 3,84 3,71 3.60
.001 15.4 10.4 8.49 7,46 6,81 6.35 6,02 5,76 5.56
.25 1.41 1,49 1.49 1.47 1.46 1.44 1,43 1.42 1.41
.10 2.99 2,61 2.40 2.27 2.18 2.11 2,06 2.02 1.98
19 .05 4.38 3.52 3.13 2,90 2.74 2.63 2.54 2.48 2.42
.025 5.92 4.51 3.90 3,56 3.33 3.17 3.05 2,96 2.88
.01 8.18 5.93 5.01 4,50 4.17 3,94 3.77 3,63 3.52
.001 15.1 10.2 8.28 7,26 6.62 6,18 5.85 5.59 5.39
.25 1.40 1.49 1.48 1.47 1,45 1.44 1.43 1.42 1.41
.10 2.97 2.59 2.38 2.25 2,16 2,09 2.04 2.00 1.96
20 .05 4.35 3,49 3,10 2.87 2.71 2,60 2.51 2.45 2.39
.025 5.87 4,46 3,86 3.51 3.29 3.13 3.01 2,91 2.84
.01 8.10 5.85 4.94 4.43 4.10 3,87 3,70 3,56 3.46
.001 14.8 9.95 8.10 7.10 6.46 6,02 5,69 5.44 5.24
Continuado
Continuado
df para numerador
para _
Denominador 1 2 345678 9
.25 1.40 1.48 1.47 1.45 1.44 1.42 1.41 1.40 1.39
.10 2.95 2.56 2.35 2.22 2.13 2.06 2.01 1.97 1.93
22 .05 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34
.025 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76
.01 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35
.001 14.4 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99
.25 1.39 1.47 1.46 1.44 1.43 1.41 1.40 1.39 1.38
.10 2.93 2.54 2.33 2.19 2.10 2.04 1.98 1.94 1.91
24 .05 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30
.025 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70
.01 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26
.001 14.0 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.80
.25 1.38 1.46 1.45 1.44 1.42 1.41 1.39 1.38 1.37
.10 2.91 2.52 2.31 2.17 2.08 2.01 1.96 1.92 1.88
26 .05 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27
.025 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65
.01 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18
.001 13.7 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64
.25 1.38 1.46 1.45 1.43 1.41 1.40 1.39 1.38 1.37
.10 2.89 2.50 2.29 2.16 2.06 2.00 1.94 1,90 1.87
28 .05 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24
.025 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61
.01 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12
.001 13.5 8.93 7.19 6.25 5.66 5.24 4.93 4.69 4.50
.25 1.38 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.36
.10 2.88 2.49 2.28 2.14 2.05 1.98 1.93 1.88 1.85
30 .05 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21
.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57
.01 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07
.001 13.3 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39
.25 1.36 1.44 1.42 1.40 1.39 1.37 1.36 1.35 1.34
.10 2.84 2.44 2.23 2.09 2.00 1.93 1.87 1.83 1.79
40 .05 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12
.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45
.01 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89
.001 12.6 8.25 6.60 5.70 5.13 4.73 4.44 4.21 4.02
.25 1.35 1.42 1.41 1.38 1.37 1.35 1.33 1.32 1.31
.10 2.79 2.39 2.18 2.04 1,95 1.87 1.82 1.77 1.74
60 .05 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04
.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33
.01 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72
.001 12.0 7.76 6.17 5.31 4.76 4.37 4.09 3.87 3.69
.25 1.34 1.40 1.39 1.37 1.35 1.33 1.31 1.30 1.29
.10 2.75 2.35 2.13 1.99 1,90 1.82 1.77 1.72 1.68
120 .05 3.92 3.07 2.68 2.45 2.29 2.17 2.09 2.02 1.96
.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22
Continuado
Continuado
df para numerador
para _
Denominador 1 2 345678 9
.01 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56
.001 11.4 7.32 5.79 4.95 4.42 4.04 3.77 3.55 3.38
.25 1.32 1.39 1.37 1.35 1.33 1.31 1.29 1.28 1.27
.10 2.71 2.30 2.08 1.94 1.85 1.77 1.72 1.67 1.63
.05 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88
.025 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11
.01 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41
.001 10.8 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10
Fuente: Adaptado y resumido de Biometrika Tables for Statisticians, 2nd ed., vol. 1 (Cuadro 18), pág. 159–163, editado por ES Pearson y HO Hartley.
Copyright © 1958, Oxford University Press. Reimpreso con permiso de los fideicomisarios de Biometrika .
ÿ TABLA G
Fuente: Resumido de la tabla de Estadísticas fundamentales para las ciencias del comportamiento (3.ª ed.), por DC Howell, 1995, Belmont, CA: Duxbury.
Números al azar
12345678 9
Continuado
Continuado
12345678 9
REFERENCIAS
511
Clark, HH (1973). La falacia del efecto del lenguaje como fijo: una crítica Darley, JM y Latané, B. (1968). Intervención de espectadores
de las estadísticas del lenguaje en la investigación psicológica. ción en emergencias: Difusión de la responsabilidad. Revista de
Diario de Aprendizaje Verbal y Comportamiento Verbal, 12, Personalidad y Psicología Social, 8, 377–383.
335–359. De Greene, KB (Ed.). (1970). Psicología de sistemas. Nuevo
Clark, WC (1969). Análisis de la teoría de la decisión sensorial de York: McGraw-Hill.
el efecto placebo sobre el criterio de dolor y sensibilidad térmica (d). Devine, PG y Elliot, AJ (1995). ¿Están realmente desapareciendo los
Revista de Psicología Anormal, 74, estereotipos raciales? La trilogía de Princeton revisada. Boletín de
363–371. Personalidad y Psicología Social, 21, 1139-1150.
Clark, WC y Yang, JC (1974). Analgésico acupuntural Dewar, RE, Kline, DW y Swanson, HA
sia: Evaluación por teoría de detección de señales. Ciencias, 184, (1994). Diferencias de edad en la comprensión de los símbolos de
1096–1098. las señales de tráfico. 73.ª Reunión Anual de la Junta de Investigación
Cohen, S., Glass, DC y Singer, JE (1973). Ruido de apartamento, del Transporte (documento n.º 940979). Washington, DC: Junta de
discriminación auditiva y capacidad de lectura en niños. Revista de Investigación de Transporte.
Psicología Social Experimental, 9, 407–422. Dewey, J. (1896). El concepto de arco reflejo en psicología.
Revisión psicológica, 3, 357–370.
Colom, R., Jung, RE y Haier, RJ (2006). Hallazgo Muñeco, R. (1955). Etiología del cáncer de pulmón. Avances en lata
el factor g en la estructura del cerebro utilizando el método de cer Research, 3, 1–50.
vectores relacionados con cor. Inteligencia, 34, 561–570. Jueves , FC (1868/1969). Acerca de la velocidad de psy
Cook, TD y Campbell, DT (1979). Cuasi procesos de chische. (Sobre la velocidad de los procesos mentales.)
experimentación: problemas de diseño y análisis para (w. Koster, Trans.). En WG Koster, Atención y desempeño II (págs.
escenarios de campo. Chicago: Rand McNally. 412–431). Ámsterdam: Holanda Septentrional.
Coren, S., Ward, LM y Enns, JT (1994). Sensación Duncan, J. (2003). Las pruebas de inteligencia predicen el cerebro
y percepción. Fort Worth: Harcourt Brace. respuesta a eventos de tareas exigentes. Nature Neuroscience,
Cornsweet, Tennessee (1962). El método de la escalera en 6, 207–208.
psicofísica. Diario Americano de Psicología, 75, Duncan, J., Seitz, RJ, Kolodny, J., Bor, D., Herzog,
485–491. H., Ahmed, A., et al. (2000). Una base neural para inteligencia
Correll, J., Park, B., Judd, CM y Wittenbrink, B. general. Ciencia, 289, 457–460.
(2002). El dilema del oficial de policía: usar la etnicidad para Duncker, K. (1945). Sobre la resolución de problemas. Monografías
eliminar la ambigüedad de individuos potencialmente psicológicas, 58, 1–112. (Entero N° 270).
amenazantes. Revista de Personalidad y Psicología Social, 83, Dunn, J. (1998). Memoria implícita y amnesia. En
1314-1329. K. Kirsner y C. Speelman (Eds.), Procesos mentales implícitos y
Corrigan, PW, Holmens, EP, Luchins, D., Buican, explícitos (págs. 99–117). Mahwah, Nueva Jersey: Erlbaum.
B., Basit, A. y Parks, JJ (1994). Agotamiento del personal en un Dweck, CS (1999). Autoteorías: su papel en la motivación, la
hospital psiquiátrico: un diseño de panel cruzado. Journal of personalidad y el desarrollo. Filadelfia: Psychology Press.
Organizational Behavior, 15, 65–74.
Papel del estado de ánimo y la connotación en el efecto espaciador. Agricultor, CM (1995). Estimaciones de efectividad para luces de freno
Boletín de la Psychonomic Society, 22, 186–188. montadas en el centro alto: un estudio de seis años. Arlington, VA:
Elmes, DG, Kantowitz, BH, y Roediger, HL Instituto de Seguros para la Seguridad en las Carreteras.
(1992). Métodos de investigación en psicología (4ª Ed.). Fechner, G. (1860/1966). Elementos de psicofísica (Vol. 1, HE Adler, DH
San Pablo: Oeste. Howes y EG Boring, Trans.). Nueva York: Holt, Rinehart y Winston.
Elmes, DG, Kantowitz, BH, y Roediger, HL
(2006). Métodos de investigación en psicología (8ª Ed.). Feingold, BF (1975). Hiperquinesis y problemas de aprendizaje
Belmont, CA: Wadsworth Thomson Learning. Habilidades vinculadas a los sabores y colores de los alimentos artificiales.
Emmons, RA (2000). ¿Es la espiritualidad una inteligencia? Revista estadounidense de enfermería, 75, 797–803.
Motivación, cognición y la psicología de la máxima preocupación. Festinger, L. (1957). Una teoría de la disonancia cognitiva.
Revista Internacional de Psicología de la Religión, 10, 3–26. Stanford, CA: Prensa de la Universidad de Stanford.
Festinger, L., Riecken, HW y Schachter, S. (1956).
Inglés, RW (2002). Capacidad de la memoria de trabajo como atención Cuando la profecía falla. Minneapolis: Prensa de la Universidad
ejecutiva. Direcciones actuales en psicología, 11, de Minnesota.
19–23. Ficken, MS, Rusch, KM, Taylor, SJ y Powers, DR (2000). El canto
Engle, R., Tuholski, SW, Laughlin, JE y Conway, del colibrí barbazul: un pináculo de vocalizaciones no
ARA (1999). Memoria de trabajo, memoria a corto plazo e inteligencia cinemáticas. Alca, 117,
fluida general: un enfoque de variable latente. 120–128.
Revista de Psicología Experimental: General, 128, 309–331. Fischhoff, B., Slovic, P. y Lichtenstein, S. (1977).
Saber con certeza: Lo apropiado de la confianza extrema. Revista de
Ericsson, KA y Simon, HA (1979). Informes verbales como datos. Revisión psicología experimental: percepción y rendimiento humanos, 3, 522–
psicológica, 87, 215–251. 564.
Fraser, S. (Ed.). (1995). Las guerras de la curva de campana: Raza, Gardner, H. (2007). Cinco mentes para el futuro (págs. 1–20).
inteligencia y el futuro de América. Nueva York: Libros básicos. Boston: Prensa de la Escuela de Negocios de Harvard.
cerebral estructural e inteligencia general. NeuroImagen, 23, 425– Holyoak, KJ y Thagard, P. (1989). Mapa analógico
433. ping por satisfacción de la restricción. Ciencias cognitivas, 13,
Haines, MM, Stansfeld, SA, Jefe, J., & Job, RFS 295–355.
(2002). Modelado multinivel del ruido de aeronaves en pruebas de Holyoak, KJ y Thagard, P. (1997). La mente analógica. Psicólogo
desempeño en escuelas alrededor del aeropuerto de Heathrow en Londres. estadounidense, 52, 35–44.
Revista de Epidemiología y Salud Comunitaria, 56, 139–144. Horowitz, LM (1974). Elementos de estadística para la psicología y la
educación. Nueva York: McGraw-Hill.
Hanowski, RJ, Kantowitz, BH y Kantowitz, SC Howard, DV y Wiggs, CL (1993). Envejecimiento y aprendizaje:
(1996). Memoria del controlador para vehículos avanzados conocimientos de pruebas implícitas y explícitas. En J. Cerella,
Huesmann, LR, Moses-Titus, J, Podolski, CL, . Jagacinski, RJ y Flach, JM (2003). Teoría de control para humanos:
Eron, LD (2003). Relaciones longitudinales entre la exposición de enfoques cuantitativos para modelar el rendimiento. Mahwah, Nueva
los niños a la violencia televisiva y su comportamiento agresivo y Jersey, Erlbaum.
violento en la edad adulta joven: 1977-1992. James, W. (1890). Principios de la psicología. Nueva York:
Psicología del desarrollo, 39, 2001–221. Bosquecillo.
Huesmann, LR y Taylor, LD (2006). El rol de Jenkins, J. (1979). Cuatro puntos para recordar: un modelo tetraédrico de
la violencia mediática en la conducta violenta. Revisión anual de experimentos de memoria. En LS Cermak & FIM Craik (Eds.), Niveles
salud pública, 27, 393–415. de procesamiento en la memoria humana (págs. 429–446). Hillsdale,
Huff, D. (1954). Cómo mentir con las estadísticas. Nueva York: Nueva Jersey: Erlbaum.
Norton. Jennings, JR y Coles, MGH (1991a). Introducción. En JR Jennings
Casco, CL (1943). Principios de comportamiento. Nueva York: y MGH Coles (Eds.), Manual de psicofisiología cognitiva.
Appleton-Century-Crofts. Nueva York: Wiley.
Hunt, E. y Lansman, M. (1975). teoría cognitiva
aplicado a las diferencias individuales. En WK Estes (Ed.), Manual Jennings, JR y Coles, MGH (Eds.). (1991b).
de aprendizaje y proceso cognitivo (Vol. 1, págs. 81–110). Hillsdale, Manual de psicofisiología cognitiva. Nueva York: Wiley.
Nueva Jersey: Erlbaum.
Hunt, E., Streissguth, A., Kerr, B. y Olson, H. Jensen, AR (1969). ¿Cuánto podemos aumentar el coeficiente intelectual y
(1995). Consumo de alcohol de las madres durante el embarazo: rendimiento escolar? Harvard Educational Review, 39, 1–123.
Efectos sobre el razonamiento espacial-visual en niños de 14 años.
Ciencia Psicológica, 6, 339–342. Jones, D. (1999). La psicología cognitiva de la distracción auditiva: la
Huxley, A. (1946). Ciencia, libertad y paz. Nueva York: conferencia BPS Bradbent de 1997. Revista británica de
Harper. psicología, 90, 167–187.
Hyde, TS y Jenkins, JJ (1969). Efectos diferenciales Kahneman, D. (1973). Atención y esfuerzo. Englewood
de tareas incidentales sobre la organización del recuerdo de una lista Cliffs, Nueva Jersey: Prentice-Hall.
de palabras altamente asociadas. Revista de Psicología Experimental, Kahng, SW, Boscoe, JH y Byrne, S. (2003). los
82, 472–481. uso de una contingencia de escape y una economía simbólica para
Hygge, S., Evans, G. y Bullinger, M. (2002). Un estudio prospectivo de aumentar la aceptación de alimentos. Revista de análisis de
algunos efectos del ruido de los aviones en el rendimiento cognitivo comportamiento aplicado, 36, 349–353.
de niños en edad escolar. Ciencia Psicológica, 13, 469–474. Kamin, LJ (1969). Previsibilidad, sorpresa, atención y condicionamiento.
En BA Campbell & RM Church (Eds.), Castigo y comportamiento
Hyman, R. (1964). La naturaleza de la investigación psicológica. aversivo (págs. 279–296).
Englewood Cliffs, Nueva Jersey: Prentice-Hall. Nueva York: Appleton-Century-Crofts.
Intraub, H. y Nicklos, H. (1985). Niveles de procesamiento y Kangas, J. y Bradway, K. (1971). Inteligencia en la mediana edad: un
memoria de imágenes: el efecto de superioridad física. Revista seguimiento de treinta y ocho años. Psicología del desarrollo, 5, 333–
de Psicología Experimental: Aprendizaje, Memoria y Cognición, 11, 337.
284–298. Kantowitz, BH (1972). Fuerza de respuesta como indicador de conflicto en
Irwin, MR y Miller, AH (2007). Trastornos depresivos e inmunidad: 20 años doble estimulación. Revista de Psicología Experimental, 110, 302–
de avances y descubrimientos. 309.
Cerebro, comportamiento e inmunidad, 21, 374–383. Kantowitz, BH (1982). Interfaz de información humana
Iwanaga, M. e Ito, T. (2002). Efecto perturbador de procesamiento y psicología de la ingeniería. En WC Howell & EA
música en el procesamiento de memorias verbales y espaciales. Fleishman (Eds.), Human Performance and Productivity (págs. 31–
Perceptual and Motor Skills, 94, 1251–1258. 81). Hillsdale, Nueva Jersey: Erlbaum.
Jacob, T., Tennenbaum, D., Seilhamer, RA, Bargiel, K. y Sharon, T. Kantowitz, BH (1985). Etapas y canales en el procesamiento de la
(1994). Efectos de la reactividad durante información humana: un análisis limitado de la teoría y la
observación naturalista de angustiados y no angustiados metodología. Revista de Psicología Matemática, 29, 135–174.
familias Revista de psicología familiar, 8, 354–363.
(Eds.), Estrés, carga de trabajo y fatiga. (págs. 395–408). Kuhn, TS (1970). Lógica del descubrimiento o psicología de la
Mahwah, Nueva Jersey: Erlbaum. investigación. En I. Lakatos & A. Musgrave (Eds.), La crítica y el
Kantowitz, BH y Sorkin, RD (1983). rostro humano crecimiento del conocimiento (págs. 1–23). Nueva York: Cambridge
tores: comprensión de las relaciones entre personas y sistemas. University Press.
Nueva York: Wiley. Kulpe, O. (1893). Esquema de Psicología. en
Kaufman, L. (1974). Vista y mente. Nueva York: Oxford. base experimental [Un esbozo de
McDougall, D., Hawkins, J., Brady, M. y Jenkins, A. Miller, NE (1959). Liberalización de conceptos básicos de RS:
(2006). Innovaciones recientes en el diseño de criterios Extensiones a conductas de conflicto, motivación y aprendizaje
cambiantes: implicaciones para la investigación y la práctica en social. En S. Koch (Ed.), Psicología: Un estudio de una ciencia
educación especial. El Diario de Educación Especial, 40, 2–15. (Vol. 2, págs. 196–292). Nueva York:
McDougall, D. y Smith, D. (2006). Innovación reciente en diseños de n Colina McGraw.
pequeña para investigación y práctica en consejería escolar Miller, NE (1985). El valor de la investigación del comportamiento en
profesional. Consejería escolar profesional, 9, 392–400. animales. Psicólogo estadounidense, 40, 423–440.
Mitchell, CJ y Lovibond, PF (2002). Hacia atrás y
Meade, ML y Roediger, HL, III (2002). Exploraciones en el contagio bloqueo directo en el condicionamiento electrodérmico humano: el
social de la memoria. Memory & Cognition, 30, 995–1009. bloqueo requiere una suposición de aditividad de resultados.
Revista trimestral de psicología experimental, 55B,
Medawar, PB (1969). Inducción e intuición en la ciencia. 311–329.
pensamiento tifico. Londres: Methuen. Mook, DG (1983). En defensa de la nulidad externa.
Merikle, PM y Reingold, EM (1992). Medición de procesos Psicólogo estadounidense, 38, 379–387.
perceptivos inconscientes. En RF Bornstein y TS Pittman Moriarty, T. (1975). Crimen, compromiso y el espectador receptivo:
(Eds.), Percepción sin conciencia: perspectivas cognitivas, dos estudios de campo. Journal of Personality and Social
clínicas y sociales (págs. 55–80). Psychology, 31, 370–376.
Nueva York: Guilford Press. Morris, CD, Bransford, JD y Franks, JJ (1977).
Merikle, PM, Smilek, D. y Eastwood, JD (2001). Niveles de procesamiento versus procesamiento apropiado
Percepción sin conciencia: Perspectivas desde la psicología de transferencia. Revista de aprendizaje verbal y
cognitiva. Cognición, 79, 114–134. comportamiento verbal, 16, 519–533.
Metcalfe, J. (1986). Las premoniciones de intuición predicen Mortimer, RG (1993). La luz de freno elevada: una causa sin teoría.
error inminente. Revista de Psicología Experimental: Aprendizaje, Actas de la 37.ª reunión anual de la Sociedad de Factores
Memoria y Cognición, 12, 623–634. Humanos y Ergonomía
Middlemist, RD, Knowles, ES y Matter, CF (1977). (págs. 955–959). Santa Mónica, CA: Sociedad de Ergonomía y
Qué hacer y qué informar: una respuesta a Koocher. Factores Humanos.
Revista de Personalidad y Psicología Social, 35, Moscovitch, M. (1982). Múltiples disociaciones de funciones en el
122–124. síndrome amnésico. En L. Cermak (Ed.), Memoria humana y
Milgram, S. (1963). Estudio conductual de la obediencia. Journal of amnesia. Hillsdale, Nueva Jersey: Erlbaum.
Abnormal and Social Psychology, 67, 371–378. Moy, P., Xenos, MA y Hess, VK (2005). Cebado
Milgram, S. (1964a). Presión grupal y acciones contra Efectos de la comedia nocturna. Revista internacional de
una persona. Revista de Psicología Social y Anormal, 69, 137–143. investigación de opinión pública, 18, 198–210.
Murphy, MD y Brown, AL (1975). Incidental
Milgram, S. (1964b). Problemas en el estudio de la obediencia: una aprendizaje en niños preescolares en función del nivel de
respuesta a Baumrind. Psicólogo estadounidense, 19, análisis cognitivo. Revista de Psicología Infantil Experimental,
848–852. 19, 509–523.
Milgram, S. (1965). Algunas condiciones de obediencia y Grupo de Trabajo de Ciencias del Comportamiento del Consejo
desobediencia a la autoridad. Relaciones humanas, 18, 57–76. Asesor Nacional de Salud Mental. (1995). Investigación básica
en ciencias del comportamiento para la salud mental: una inversión nacion
Milgram, S. (1974). Obediencia a la autoridad: una visión experimental. ment (resumen ejecutivo). Ciencia Psicológica, 6, 192–202.
Nueva York: Harper & Row.
Miller, AG, Collins, BE y Brief, DE (1995). Perspectivas sobre la Consejo Nacional de Seguridad. (1999). Hechos de lesiones, 1999 Edi
obediencia a la autoridad: El legado de los experimentos de ción Itasca, IL: Autor.
Milgram. Revista de Asuntos Sociales, 51, Natsoulas, T. (1967). ¿De qué tratan los informes perceptivos?
1–19. Boletín Psicológico, 67, 249–272.
GLOSARIO
formato APA el formato de artículo de revista especificado por el Vista ciega según Weiskrantz, el efecto de ciertos tipos de daño cerebral en el
Asociación Americana de Psicología (APA); el Manual de Publicaciones que el sujeto no puede reconocer objetos pero conserva la capacidad
de la APA se encuentra actualmente en su quinta edición de detectar la presencia y el movimiento de los objetos .
Afásico una persona que tiene un trastorno del lenguaje; generalmente asociado
con daño en el hemisferio izquierdo del cerebro El bloqueo de un estímulo condicionado previamente aprendido bloquea el
aprendizaje de un nuevo estímulo condicionado presentado en un
Aparato una subsección de la parte del método de un documento técnico que
compuesto con él porque el nuevo es redundante
describe cualquier equipo especial utilizado en la investigación para evaluar
a los participantes. Procesos cognitivos de procesamiento de abajo hacia arriba que implican la
extracción de características que comienzan con la estimulación sensorial.
Investigación aplicada Investigación dirigida a la solución de un problema
práctico. Condiciones de contorno las condiciones necesarias para
producir un fenómeno, o las condiciones requeridas para obtener el
La media aritmética suele llamarse la media, es una medida
fenómeno
seguro de tendencia central que es la suma de las puntuaciones dividida
por el número de puntuaciones La técnica de Brown-Peterson es una forma de estudiar la memoria a
corto plazo que consiste en presentar primero un elemento que
Transferencia asimétrica ver efecto de arrastre
debe recordarse y luego presentar material que limita el ensayo para
Tarea auditiva extraña: una tarea de monitoreo en la que el observador un intervalo de retención antes de una prueba de retención.
cuenta el menos frecuente de dos estímulos auditivos distintos.
Fenómeno autocinético: la percepción por parte de una persona en una efecto de arrastre el efecto relativamente permanente que los sujetos de
habitación oscura de que un solo punto de luz estacionario parece prueba en una condición tienen en su comportamiento posterior en
moverse. otra condición
Cuadrado latino equilibrado un esquema de contrapeso en Lista categorizada de palabras usadas en experimentos de memoria que están
en el que cada condición es precedida y seguida con la misma frecuencia relacionadas por ser miembros de la misma categoría; por ejemplo,
por cualquier otra condición artículos de mobiliario: silla, cama, sofá, mesa
Línea de base una medida utilizada como base para la comparación, generalmente Porque inferimos una causa a partir de resultados experimentales cuando
cuando no se administra ningún tratamiento vemos un efecto producido por el factor variado
Investigación de investigación básica destinada a aumentar la comprensión Efecto techo ver Efectos de atenuación de escala
fundamental .
Cuello de botella central: una clase de modelos de atención que postulan
Conductismo la escuela de psicología, originada por John procesamiento secuencial tardío de una tarea a la vez
Watson, que dirigió la atención de los psicólogos al estudio del
Tendencia central el centro de una distribución de puntajes; estadísticas
comportamiento manifiesto, no a la mente o los eventos mentales.
descriptivas que indican el centro de una distribución de puntajes (ver
Beta ( ) un estadístico en la teoría de detección de señales relacionado con el Media, mediana)
criterio adoptado por el observador
Diseño de criterio cambiante un diseño de n pequeña en el que el criterio para
Ondas beta de baja amplitud, ondas cerebrales rápidas vistas durante obtener algún resultado cambia sistemáticamente con el tiempo.
atención a las tareas cognitivas
Varianza entre grupos una medida de la dispersión entre grupos en un Sala china un experimento mental desarrollado por Searle que supuestamente
experimento demuestra que la inteligencia artificial es imposible
Bit la unidad básica de información medida en dígitos binarios variables en la investigación de contingencias
Psicología cognitiva el estudio de cómo las personas adquieren, Variable de control una variable independiente potencial que se mantiene
almacenar y usar información constante en un experimento
Cohorte a las personas que tienen una edad equivalente a la persona que Operaciones convergentes un conjunto de líneas de investigación
se examina en un estudio del desarrollo. relacionadas que refuerzan una conclusión común
Estímulo condicionado (CS) un estímulo originalmente neutral que, a través decisión para determinar si decir "sí" o "no" a la presencia de un
adquiere la capacidad de provocar la respuesta originalmente producida Validez de criterio ver Validez predictiva
solo por el estímulo incondicionado.
Experimento crítico un experimento clave que pretende distinguir entre
Confidencialidad la directriz del investigador que establece que la teorías en competencia.
información obtenida sobre los sujetos debe permanecer
confidencial a menos que se acuerde lo contrario El procedimiento de correlación de panel cruzado implica
varias correlaciones que ayudan a determinar la dirección de la
Sesgo de confirmación la tendencia a buscar información que confirme en
posible causalidad entre las variables
lugar de refutar la hipótesis de uno.
Interacción cruzada la inversión del efecto de uno
Conformidad que pone el comportamiento de acuerdo con lo social.
variable independiente en una variable dependiente en un cierto
normas
nivel de una segunda variable independiente
Confundir la variación simultánea de una segunda vari
Diseño de diseño transversal que usa una gran muestra de la población
capaz con una variable independiente de interés para que cualquier
de varias edades al mismo tiempo para fines de prueba (en contraste
efecto sobre la variable dependiente no pueda atribuirse con certeza a
con el diseño longitudinal)
la variable independiente; inherente a la investigación correlacional
Diseño secuencial cruzado: un experimento que combina los
procedimientos transversales y longitudinales.
Validez de constructo cuando varias medidas se ajustan sensatamente
juntos y convergen en (y pueden ser explicados por) un concepto d una estadística en la teoría de detección de señales relacionada con la
psicológico subyacente sensibilidad del observador
Contingencia la relación entre una respuesta y su resultado en el Data las puntuaciones obtenidas en una variable dependiente
condicionamiento operante o la relación estímulo condicionado-
Procesamiento basado en datos ver Procesamiento ascendente
estímulo incondicionado en el condicionamiento clásico
engaño una técnica de investigación en la que se engaña al participante sobre Escalado directo Técnica de escalado en la que el observador
algún aspecto del proyecto; puede ser poco ético responde directamente en unidades de escala psicológica
Umbral de decisión el estímulo que provoca una respuesta que resulta tanto Estímulo discriminativo (SD) un estímulo que indica si una respuesta será
del criterio como de la fuerza del estímulo (ver Beta, d )
reforzada o no
Difusión de la responsabilidad la tendencia de los individuos a asumir menos Electroencefalograma (EEG) un registro de la actividad eléctrica del
responsabilidad para actuar en una situación de grupo cerebro que se realiza mediante electrodos colocados en el cuero
cabelludo
Aproximación directa a la percepción La idea de Gibson de que recogemos
y utilizamos directamente la información que nos proporciona el Ley de Emmert el tamaño de una imagen residual es proporcional a la distancia
entorno. de visualización
Enfoque empírico en contraste con el ap analítico Prueba de memoria explícita una prueba de memoria que requiere que una
enfoque, intentos de lograr poder predictivo sobre la base de persona trate conscientemente de recordar eventos específi cos
regularidades empíricas
Variables extrañas variables de control, también conocidas como
Teoría empírica de la percepción el argumento de que las percepciones variables molestas
y fechado personalmente
Validez aparente la condición en la que un instrumento de medición
Intervalo igual propiedad de las escalas de medición tal que un cambio intuitivamente parece medir lo que se supone
de una unidad es equivalente en todo el rango de la escala para medir
Potencial relacionado con eventos (ERP) un tipo de onda cerebral que se Ley de Fechner la relación logarítmica, desarrollada por k log(s)
mide poco después de un estímulo evocador específico (ver N100, Fechner, de la sensación a la intensidad del estímulo:
N400, P200 y P300)
Investigación de campo Investigación realizada en entornos naturales .
Ex post facto literalmente, “después del hecho”; Describe las condiciones en donde los sujetos normalmente no saben que están en un experimento
un experimento que no se determinan antes del experimento, sino solo
después de que se haya producido alguna manipulación de forma
Figuras presentaciones gráficas de datos en las secciones de resultados
natural.
de un informe de investigación
Experimentar la manipulación sistemática de algunos factores del entorno
Flashbulb memory la memoria vívida de uno para escuchar el
para observar el efecto de esta manipulación en el comportamiento.
noticia de un evento sorprendente
variable dependiente pueda atribuirse a la manipulación de la variable medir el flujo sanguíneo en el cerebro, un correlato de la actividad
independiente neuronal
Error experimental cualquier variación en la variable dependiente que no prueba de reconocimiento de elección forzada una prueba en la que el
sea causada por la variable independiente participante debe seleccionar entre dos o más afirmaciones; a menudo
se utiliza para controlar los estilos de respuesta
Extinción experimental cuando el reforzador de una respuesta
instrumental ya no se da después de la respuesta Fraude la distorsión deliberada de los resultados de la investigación, que
incluye la fabricación de datos, la alteración de los datos y
deliberadamente no informar los resultados que se consideran
Hipótesis experimental la hipótesis de investigación que especifica los inapropiados para los intereses de uno.
efectos de las variables independientes (en contraste con la hipótesis
nula) Prueba de recuerdo libre en la que los sujetos recuperan el futuro
elementos recordados sin la ayuda de recuperación externa
Fiabilidad experimental la medida en que los resultados experimentales
señales; pueden recordar en cualquier orden, por lo que recordar es libre
pueden reproducirse o se obtendrán de nuevo si se repite el experimento en ese sentido
Psicología de la Gestalt la escuela de psicología que enfatiza los patrones Incubación durante la resolución de problemas, un momento en que una
completos como importantes en la percepción, en lugar del análisis persona recurre a otros asuntos después de no poder resolver el problema
artificial de la experiencia en partes (como en el estructuralismo) Se dice que el problema se incuba, como lo hacen los huevos mientras una
gallina se sienta sobre ellos, y se puede resolver más rápidamente más adelante.
Graphemic el nivel de letra del análisis perceptivo. variable independiente la variable manipulada por el experimentador
Efectos de interacción de interacción de orden superior que involucran Procedimientos estadísticos inferenciales para determinar la
más de dos variables independientes en experimentos multifactoriales confiabilidad y generalidad de un hallazgo experimental particular
Histograma una distribución de frecuencia en la que la altura de las barras Punto de inflexión el punto de una curva normal en el que la cola comienza
en el gráfico indica la frecuencia de una clase de puntajes; también a extenderse; una desviación estándar de la media
llamado gráfico de barras
La historia produce una posible confusión en la investigación que, Información de hechos; datos del mundo exterior; también una
inadvertidamente, se lleva a cabo entre mediciones debido a cambios unidad de medida en teoría de la información
históricos en el participante.
Consentimiento informado decisión de los posibles participantes
Acertar en la detección correcta de una señal que se ha presentado de participar en un experimento
Homogeneidad de la varianza el análisis de la varianza asume que Insight el momento de la iluminación en la resolución de problemas; cuando
las varianzas dentro de los grupos de las diferentes condiciones se “eclosiona” una idea; a veces acompañado de una experiencia "ajá"
son equivalentes
homogéneo similar; del mismo tipo que otros Comité Institucional de Cuidado y Uso de Animales (IACUC) un comité
que supervisa la protección de los sujetos animales en casi todas
Factores humanos la disciplina que trata de optimizar la relación entre la
las instituciones de los Estados Unidos que realizan investigaciones
tecnología y el ser humano
Niveles de procesamiento un marco para estudiar la memoria que predice Edad mental la edad intelectual de un individuo medida por una prueba de
que las tareas de codificación semántica o “más profunda” producirán coeficiente intelectual en contraste con la edad cronológica
una mejor memoria para el material que las tareas de codificación
Carga de trabajo mental una variable interviniente, similar a la atención, que
perceptual o “superficial”
modula la sintonía entre las demandas del entorno y la capacidad del
Búsqueda de literatura un método de búsqueda de bases de datos en organismo.
una biblioteca o en la Web usando una computadora
método una sección de un documento técnico que describe en detalle las
Diseño longitudinal Pruebas repetidas de un grupo de operaciones realizadas por el experimentador
personas a medida que envejecen (en contraste con el diseño transversal)
método de autoridad un método para fijar la creencia en el que la palabra de
Recuperación de la memoria a largo plazo de recuerdos que han desaparecido una autoridad se toma como fe (en contraste con
de la conciencia después de su percepción inicial Empírico)
Tarea de monitoreo: una forma de escucha dicótica en la que no se escala nominal una escala de medida que posee la propiedad de la
requiere que los observadores verbalicen un mensaje tal como diferencia
se presenta. Prueba no direccional ver Prueba de dos colas
relación monótona la relación entre dos
Pruebas no paramétricas Pruebas estadísticas que no hacen
variables en las que un aumento en una variable es
suposiciones sobre la distribución de la población subyacente;
acompañado por un aumento o disminución constante en la
generalmente se usa cuando los datos no están en el intervalo /
otra variable
nivel de relación
Escala ordinal una escala de medida que posee las propiedades de Feromonas olores emitidos por una persona (o animal) que están
diferencia y magnitud relacionados con la receptividad sexual
Ordenar el eje vertical (o eje Y) en un gráfico Fonémico (fonológico) el nivel de sonido del análisis perceptual de las
palabras
Estructuras de organización del conocimiento existente; un carácter
característica de una buena teoría Visión fotópica visión controlada por los conos en el
retina, típicamente en condiciones de visualización diurna
P200 y P300 componentes positivos del potencial relacionado con el evento
que ocurren 200 y 300 ms, respectivamente, después del inicio del Efecto placebo: la mejora que a menudo se muestra en los medicamentos.
estímulo que indican la atención al estímulo estudios de eficacia cuando los pacientes creen que han recibido
un fármaco, aunque en realidad han recibido una sustancia inerte
Recuerdo asociado por pares una tarea de memoria en la que se dan
un par de palabras (p. ej., mangosta-elefante); luego se proporciona
la primera palabra y la tarea es recordar la segunda palabra Plagio el uso no acreditado de las palabras, datos o ideas de otra persona
Pruebas paramétricas Pruebas estadísticas que asumen una normalidad puede extraer una muestra)
distribución de puntajes y nivel de intervalo o razón de La imagen remanente positiva es similar en brillo y color a
medición el estímulo visual original
Parsimonia utilizando el menor número de declaraciones en un El efecto de contraste positivo rara vez encuentra mejoras en el
teoría comportamiento cuando se aumenta la magnitud del reforzamiento y
refuerzo parcial un programa de refuerzo en se compara el comportamiento con el que siempre ha sido seguido
por una gran magnitud de reforzamiento.
que una recompensa sigue a una respuesta deseada solo en
algunas ocasiones Correlación positiva Relación observada entre dos variables en la que
un cambio en una variable va acompañado de un cambio en la
Efecto de extinción del refuerzo parcial (PREE) el
misma dirección en la segunda variable.
mayor resistencia a la extinción exhibida por las respuestas aprendidas
bajo programas de reforzamiento parciales en lugar de continuos
Estímulo reforzante positivo Estímulo que, cuando
presentado, aumenta la probabilidad de la respuesta que lo produjo
Observación participante Técnica de observación en la que el
observador participa con los observados; por ejemplo, vivir con
gorilas en la naturaleza Potencia (de una prueba estadística) la probabilidad de que una
prueba rechace la hipótesis nula cuando en realidad es falsa
Pearson r una medida paramétrica de correlación entre dos variables
Efecto de práctica un efecto de arrastre en un experimento tal que el
comportamiento mejora durante el experimento debido a la práctica
Percepción el proceso de toma de conciencia típicamente visto como
y no a la variable independiente
más complejo que la sensación y por lo general implica una
interpretación de la sensación
Precisión la cualidad de ser exactamente especificado
Defensa perceptiva : falta de voluntad para informar que se ha percibido
material desagradable, en contraste con la incapacidad para Declaración de predicción de un resultado futuro antes de que se obtengan los datos.
Efecto de primacía: la mejor retención de la información se produce al principio Año de vida ajustado por calidad (QALY) una estimación ajustada
de una lista, en relación con la información en el medio. estadísticamente del bene cio de la nueva tecnología
Experiencia previa principal que puede no facilitar el comportamiento Cuasi-experimento un experimento en el cual la variable independiente ocurre
(principal) naturalmente y no está bajo el control directo del experimentador.
Procedimiento una subsección de la sección de método de un Muestra aleatoria Muestra no sesgada en la que cada unidad de la población
tiene la misma probabilidad de ser seleccionada.
documento técnico que explica lo que les sucedió a los participantes/
sujetos y contiene suficiente información para que otra persona pueda Selección aleatoria un procedimiento que asegura que cada miembro de una
replicar el estudio (repetir el estudio exactamente como se realizó población tenga la misma oportunidad de participar en un experimento
originalmente)
Protección contra daños compromiso ético de los investigadores Diseño de grupos aleatorios: la asignación aleatoria de sujetos a condiciones
para proteger a sus súbditos de cualquier daño en un diseño entre sujetos.
Pseudocondicionamiento de una elevación temporal en la mañana Aleatorización un procedimiento de muestreo estadístico donde cada
plenitud de la respuesta condicionada que no se debe a la asociación elemento tiene la misma probabilidad de ser seleccionado
entre el estímulo condicionado y el
estímulo incondicionado
Criterio de cambio con límite de rango una variación del diseño de
Período refractario psicológico en las reacciones de elección criterio de cambio, en el que los criterios para los resultados tienen
con un retraso entre estímulos, el período en el que se retrasa el tiempo un rango especificado por un límite superior e inferior
de reacción de la segunda respuesta
Psiconeuroinmunología un campo interdisciplinario que examina las relaciones Escala de razón una escala de medición que posee las propiedades de
entre el comportamiento, los procesos neuronales, endocrinos e diferencia de magnitud, intervalos iguales y un punto cero significativo
inmunológicos.
Métodos psicofísicos como el método de los límites que inició Fechner e Experimento de tiempo de reacción un experimento en el que el tiempo es la
incluyen métodos modernos como la detección de señales. medida dependiente; por lo general, las reacciones aceleradas se miden
en estos experimentos
Psicofísica el estudio de cómo los cambios en los estímulos físicos se Reactividad La reacción no planificada de un participante a la
traducen en experiencia psicológica investigador o entorno de investigación que puede confundir los
resultados de la investigación
Psicofisiología que utiliza medidas físicas para inferir procesos psicológicos
(en contraste con Psicofísica) Recordar una medida de retención en la que se requiere la reproducción del
material
Castigo un estímulo que, cuando se presenta, disminuye
la probabilidad de la acción que lo produjo Característica operativa del receptor (ROC) véase ROC
función
Artefactos de regresión un artefacto en la medición del cambio en una Diseño de reversión (ABA) un diseño de n pequeña en el que el
variable cuando los grupos de sujetos que puntuaron en los extremos comportamiento de un sujeto se mide bajo una condición de referencia
de la variable se prueban nuevamente (ver Regresión a la media) (A), luego se aplica un tratamiento experimental durante la fase B y se
observa cualquier cambio en el comportamiento; finalmente, las
condiciones iniciales originales (A) se restablecen para asegurar que el
Regresión a la media la tendencia al extremo
tratamiento experimental fue responsable de cualquier cambio observado
medidas sobre alguna variable para estar más cerca de la media del
durante el
grupo cuando se vuelven a medir, debido a la falta de fiabilidad de
medición fase B
Investigación relacional investigación que trata de determinar cómo Corriendo encabezado el encabezado que aparece en la parte superior de la
dos o más variables están relacionadas página de un artículo publicado
La confiabilidad de los resultados se refiere a la repetibilidad de un ex el número de intentos necesarios para volver a aprender el material
estimación de la probabilidad de que un hallazgo sea repetible; también El puntaje de ahorro es la diferencia entre el número de
se refiere a la consistencia de una prueba o instrumento de medición ensayos en el aprendizaje original (OL) de una lista y su reaprendizaje
determinada al calcular una correlación entre las puntuaciones obtenidas (RL) dividido por el número de intentos en el aprendizaje original, con
por los participantes que toman la prueba dos veces (confiabilidad de esta relación multiplicada por 100
prueba-reevaluación) o que toman dos formas paralelas diferentes de la
Dificultades de interpretación de los efectos de atenuación de escala
prueba (confiabilidad de prueba paralela), o examinando las puntuaciones
resultados cuando el desempeño en la variable dependiente es casi
obtenido en dos mitades de la prueba (confiabilidad de dos mitades)
perfecto (un efecto techo) o casi inexistente (un efecto piso)
Eliminar las consecuencias dañinas Los intentos de los investigadores éticos
de eliminar cualquier consecuencia dañina en la que sus sujetos puedan
Método científi co la formulación y prueba de hipótesis mediante observación
haber incurrido.
y experimentación sistemáticas; la formulación y prueba de teorías por
Replicación la repetición de un experimento anterior para duplicar (y tal inducción y deducción
vez extender) sus hallazgos (ver también
replicación sistemática)
Escotoma una región de ceguera en el campo visual causada por un defecto
Representatividad un problema relacionado con si las variables en un físico en el sistema visual
experimento permiten extensiones a situaciones más generales
Visión escotópica visión nocturna controlada por los bastones
en la retina
Reproducibilidad ver Fiabilidad
Tarea secundaria una tarea adicional en la que el desempeño es un
Condicionamiento respondiente ver Condicionamiento clásico índice de atención
Restricción del rango cuando la muestra no representa el rango completo Autocorrección un procedimiento que detecta y repara automáticamente
de valores posibles para una variable o factor dado; reduce el grado los errores
de una correlación o relación observada entre dos variables
Análisis semántico significativo de las palabras.
Establecer el efecto de la expectativa de la cognición; por ejemplo, si las la vida es cualitativamente diferente de la vida humana
personas resuelven los problemas de una manera particular, a menudo Compensación entre velocidad y precisión en los experimentos de tiempo de
abordarán los nuevos problemas de la misma manera establecida, aun reacción, la capacidad del respondedor para sustituir cambios en el
cuando la estrategia original ya no sea efectiva; también llamado porcentaje de respuestas correctas por cambios en la velocidad de
Einstellung, del experimento alemán original respuesta
Prueba de signos una prueba no paramétrica utilizada para determinar diferencias niveles de la variable independiente, etc.
diferencias entre dos conjuntos de puntajes obtenidos en un
Método de escalera: un método más nuevo de procedimiento de límites que
diseño de medidas concentra las presentaciones de estímulo alrededor del umbral.
Análisis simple (de un factor) un análisis de varianza para un experimento dividida por el número de puntajes
que tiene una variable independiente con más de dos niveles Error estándar de la media la desviación estándar de
Reacción simple ver reacción de Donders A Reglas de predicción estadística basadas en variables predictoras e
Simulación de participantes de control participantes experimentales información de diagnóstico que se puede consultar durante las decisiones
esperan que actúen los demás (p. ej., se les dice a las personas que Fiabilidad estadística que rechaza la hipótesis nula sobre la base de una
simulen la hiponosis) prueba estadística que arroja un nivel alfa de menos de .05
experimentalmente (p. ej., altura, peso, sexo y coeficiente intelectual) Umbral ver Umbral absoluto y Umbral de diferencia
Medidas subjetivas Informes introspectivos dados en escalas de calificación Diseño de retardo de tiempo un diseño cuasi-experimental similar a
que por lo general no pueden verificarse objetivamente el diseño transversal en el que se comparan personas de diferentes edades
en diferentes momentos para que su edad en el momento de la prueba sea
Informe subjetivo informe verbal de lo percibido por una persona
estado mental la misma
Medidas discretas medidas tomadas desde el re Diseño intra-sujetos un diseño experimental en el que cada sujeto es evaluado
bajo más de un nivel de la variable independiente
resultados de la conducta, no de la conducta misma (ver
No reactivo)
Observaciones discretas ver No reactivo Tarea de finalización de fragmentos de palabras Prueba de memoria
implícita en la que el sujeto tiene que completar las letras que faltan
Validez si un procedimiento u observación es sólido o en una palabra fragmentada.
auténtico
Carga de trabajo la cantidad de esfuerzo que demanda atención
Variable algo que se puede medir o manipular. impuesto a una persona
Varianza una medida de dispersión; la desviación estándar Sí/no prueba de reconocimiento una prueba de memoria en la que sub
al cuadrado Los sujetos deciden si cada ítem fue estudiado o no (diciendo sí o no)
Verifi cación la etapa final en la resolución de problemas que implica la una puntuación individual y la media se expresa en unidades de
desviaciones estándar
verificación cuidadosa de una solución potencial
ÍNDICE DE NOMBRES
ÍNDICE DE MATERIA
alternativas a, 92 Parcialidad
545
rendimiento académico y, 345–350 edad y, 336– autoridad, 6–7 Método de límites, 158, 159–162, 167,
339 artifi cial (IA), 340, 443 defi niciones 184, 192 Método de tenacidad, 7
investigación de campo, 417–425, 425–426 cognitivas de, 339–345 definido, 335, 343–345
futuro de, 20 carga de trabajo mental, 417– genética y, 331 medición, 330, 334, 340
425, 427–428 observación naturalista, 28, 29 motivación y emoción, 350–354 inteligencias
principio primario de, 412–413 señales de múltiples, 343, 355
tráfico, 429–431 valor de la vida y, 413–415
variables en, 414, 416, 417–425
Diferencias de modalidad, 268–273, 291–292 Escalas ordinales, 170, 171 enfoques a, 329 técnica
Motivación, 350–354 ordenada, 78 correlacional, 26, 39–40 teorías, papel de, 8,
“Efecto Mozart”, 109–118 Organización de datos, 8–9 10 frente a explicación, 18 Validez predictiva,
resonancia magnética, 443 Exceso de confianza en el juicio, 315–319 329 Prejuicio, 378–381 Preparación (en
Análisis de varianza multifactorial, 482–486 Sobrecarga, 211 resolución de problemas), 320 Tarea principal,
Inteligencias múltiples, 343–345 418, 419– 420, 422 Prime, 378, 380 Prime Sight,
Diseño de línea de base múltiple, 250–252 Pruebas de recuerdo de pares asociados, 266, 267 190 Priming, 190–194, 197–198, 267, 282, 288–
Procesamiento distribuido en paralelo (PDP), 443 289, 378
NASA, 418–422 Formas paralelas (de pruebas), 334
Teoría nativista, 181. Estimación de parámetros, 14
Naturalismo, 14 Parámetros, defi nidos, 459
Observación naturalista, 26–27, 392 Pruebas paramétricas, 469
Teoría de la naturaleza, 330–331 Parsimonia, 14 Interferencia proactiva, 269 Teoría
Contraste naturaleza-crianza, 330, 331–333, 359–360 Efecto de extinción del refuerzo parcial de la probabilidad, 490–491
Imágenes secundarias negativas, 189 (PREE), 253–256 Resolución de problemas. Véase Pensamiento y
Efectos de contraste negativo, 242, 243 Efecto participante. Véase Reactividad resolución de problemas Procesamiento, niveles
Correlación negativa, 38, 39 Observación de los participantes, 30 de, 274–281 Procesamiento, transferencia apropiada,
Estímulos reforzantes negativos, 233. Investigación de Pavlov, 35, 229–231 280–281 Prueba de productos, 412 Protección contra
transferencia negativa, 215 Coeficiente de correlación producto-momento de daños, 87 Pseudocondicionamiento, 234 Revistas
Neurotransmisores y personalidad, 331 Pearson (r de Pearson), 38–40, 43, 456–458 psicológicas, 105 Período refractario psicológico, 217–
Ruido, ambiental, 389, 401–405, 405–407, 409 Precisión de la percepción de, 26–27 de 220, 223 Psicología, científi ca , 3–23 definido, 7 primeros
profundidad, 201–203 niveles de , 183, 274–275 trabajos en, 435–438 objetivo de, 4 tendencias modernas
Ruido en la detección de señales, 163–169 de significado, 190–195 medidas de, 186 en, 442–446 orígenes de, 433–435 investigación y vida real,
Escalas nominales, 170–171 memoria como subproducto de, 274 definición 19–21 escuelas de, 438–442, 446 especialización, 18, 444–
Pruebas estadísticas no direccionales, 467, 469 operativa de, 195–196 psicofísica y, 154–156 446 Psiconeuroinmunología, 228 Métodos psicofísicos,
Pruebas no paramétricas, 469 infl uencia social en, 360 Investigación de la 154–155 Psicofísica, 153–179 definido, 154 fundación
Sílabas sin sentido, 263–265 percepción, 180–206 de, 437 escalas de medición, 155, 169–173 definiciones
Curva normal/distribución normal, operativas, 155–156 teoría de detección de señales, 162–
454–456, 464, 465, 468, 495–497 169 diseños de n pequeña , 156, 174–176, 246 estímulos
línea normal de mirada, 426; y juicios, 155, 159–160 umbrales, determinantes, 158–
Normas, 360 162 variables en, 157 Ley de Weber, 161, 171–172, 178–
Contingencia nula, 233; 179 Psicofisiología, 443 PsycINFO, 148 Política pública,
Hipótesis nula, 302, 463–464, 465 conciencia 391, 423–425 Publicaciones. Véase Búsquedas bibliográficas;
Resultados nulos, 55–57 vista ciega, 183–186 falta Informes de investigación Inserción pura, 212, 215
Nutrir la vista, 330–331 de conciencia verbal, 190–195 percepción
sin conciencia, 196–198 informes verbales, 187–195
Obediencia a la autoridad, 362–370 ilusión de distancia de color, 201–204 enfoque directo
Medidas objetivas, 418, 420. a, 181–183 teoría empírica de, 181 enfoque indirecto a,
objetividad, 35 181–183
Observación
65, 79, 241, 247, 307, 364 Medidas clasificadas, fraude, 94, 371 generalidad de los resultados y, 307–309 gráficos, 103, 104, 119, 120 introducción, 102, 106,
170 Escalas de razón, 170, 171, 172 , 291 Tiempo de razón para, 308, 316, 318 confiabilidad estadística, 306– 108, 111, 119, 120, 124–128, 143
reacción (RT). Véase también Atención y 307 sistemática, 307, 308, 310 Investigación. Ver también
142
Reactividad
Período refractario, psicológico, 217–220, 223 sujetos, 64–65, 67–68, 215, 235–238, 250–252, 256, 259,
363, 469 Muestra, definida, 458–459
Artefactos de regresión, 74–75, 345– Generalización de la muestra, 393
350, 356–357 condiciones de control, 67–68 Medias de la muestra, 460–463, 461–465 Tamaño
Regresión a la media, 74–75, 329 transversal, 337–338 diseño secuencial de la muestra, 302, 467, 476, 488–489 Muestreo,
Refuerzo, 233, 253–256, 259–260 cruzado, 339 experimentos doble ciego, 79, 458–459 Método de ahorro, 265 Puntaje de
Diseño de medidas relacionadas, 471 70 efectos sobre el resultado, 237, 240– ahorro, 264– 265 Atenuación de escala, 173 Efectos
Enfoque relacional, 36–48 causalidad y, 241, 243 estudios ex post facto , 401–402 diseño de atenuación de escala, 268–274 Ciencia. Ver
46–47 procedimientos correlacionales longitudinal, 338 diseño de grupos, 237 diseños mixtos, también Psicología, elementos básicos científi cos
complejos, 44–46 investigación de contingencia, 36–38 67 diseño de línea de base múltiple, 250–252 dificultades de, 9–10 beneficios de, 7–8, 20, 91, 389–390
coeficiente de correlación, 38–40 investigación de correlación, (reducción de errores), 68–71 cuasi-experimentos, 71– curiosidad, papel de, 5–6 enfoque deductivo versus
36–37 75, 345–347, 389, 401–402 inductivo, 9–10 definido, 7 limitaciones of, 390–391
334, 335 diseño de grupos aleatorios, 235 418, 419–420, 422–423 Nivel semántico de análisis, 274–
diseños de n pequeña, 66–67, 246–253, 415–417 diseño de 275 Sensación, 181, 438. Véase también Psicofísica
Recordar y olvidar, 261–296 Ataques terroristas del 11 intervalo de tiempo, 339 diseños dentro de sujetos, 64, 65– Sensibilidad, medición, 168, 175 Sensibilidad del
de septiembre, 296 recuerdos autobiográficos, 296 66, 215, 235–238, 255, 259 observador (d), 166 –168, 186–188
La contribución de Ebbinghaus, 262–266 curva de
olvido, 265 pruebas de memoria implícita/explícita, Participantes de la investigación. Véase también
281–291 niveles de enfoque de procesamiento, 274– Investigación con animales; Variables, ética/
281 medidas de memoria, 264 –266, 267, 279–281 estudio protección de la asignatura, 83–89, 389, 403–405
de memoria: manuscrito de muestra en estilo APA, 121– expectativas de, 371, 372, 384 efectos del experimentador,
142 efectos de modalidad/atenuación de escala, 268–273 69–71 emparejamiento, 64, 65 reactividad, 27, 28, 370,
ruido y, 401–402, 409 lectura versus escucha, 269– 387 estudiantes como, 77, 84 retirarse de los estudios,
273, 291–293 social contagio de la memoria, 361 variables 87, 337 Informes de investigación, 99–149 lista de
en investigación sobre, 267–268 variedades de verificación del lector crítico, 105–108 partes/formato de,
102, 128, 144 autores, 93, 101, 121, 122 Modificabilidad separada, 210, 212 Ataques
terroristas del 11 de septiembre, 296
definido, 359 ética en, 370, 375–376, 378 Ley de potencia de Stevens, 172–173 absoluto, 158–159, 161, 172, 177
investigación de campo, 374–378 investigación sobre Estímulos conocimiento, 198 decisión, 166, 169
hipnosis, 370–374 orígenes de, 359–362 facilitación en condicionamiento clásico, 229–231, 233– detección, 192 determinación, 158–162, 170–
social, 381–384 estereotipos y prejuicios, 378–381 235, 238–240 estímulo discriminativo 173 diferencia, 160–162, 171, 178–179
variables, 362–363, 367–370, 374–375, 378–381 Social (SD), 233 en condicionamiento operante, 231– objetivo, 194–195 definición operativa de, 157
Science Citation Index (SSCI), 149 Especismo, 90 233 refuerzo, 233 Contraste de estímulo, 240– de dolor, 168–169
Compensación de precisión de velocidad, 215–220, 244 Error de estímulo, 438 Intensidad de
226 Fiabilidad de mitades divididas, 334 Técnica de estímulo, 235, 238–240 Asincronía de inicio de
camada dividida, 237 Estabilidad, 56, 335–336 estímulo (SOA), 217–220, 223 Estrés, 394, 395 IA
Método de la escalera, 161–162, 176–177 Desviación fuerte, 340–342 Efecto Stroop, 190–195, 197, 206 curva ROC y, 166 subjetivo,
estándar, 453, 454, 455, 456, 461–462 Error estándar Consistencia estructural, 310 Psicología estructural, 194–195, 196–197, 198 visual, 176–177, 188
de la media, 461–463 Puntuaciones estándar. Ver 316 Estructuralismo, 438–439, 441, 446
Análisis estadístico de puntajes Z, 448–493 Variables del sujeto. Ver Variables, sujeto Medidas El tiempo como variable, 47
subjetivas, 418, 420 Informes subjetivos. Ver Diseño de retardo de tiempo, 339.
pruebas de diferencias entre dos Fiabilidad test-retest, 334, 335 causalidad y, 47, 53–54 partes
Modelo tetraédrico de memoria, 276–277 complejas e interactivas, 47–48 definidas, 36, 55
teorías emparejamiento, 73–74, 237 Variables, confusión,
supuestos incluidos, 11–12 cambios en, 71–75, 211–214, 414.
10 experimentos críticos y, 54 vista
deductiva de, 10–11 definido, 8, 9, 10 Véase también Confundir
grupos, 469–476 usos evaluación, 14–15 vista de falsabilidad, variables, controlar
de, 103–105, 306 mal uso de 11 funciones de, 8–9, 17–18 defi nido, 57, 362
estadísticas, 487–490 descripción generalizaciones y, 12–14 efectos del experimentador como, 70
general, 78, 449 estadísticas no fi jación funcional, 311–315 ejemplos de
paramétricas, 170 estadísticas investigación, 157, 187, 211, 234, 268, 304, 333, 363, 395,
paramétricas, 170 414
53, 54, 240–244, 311–312 ejemplos de investigación, vista ciega, 183–185, 187–188,
73, 299, 332–333, 414 189–190 289
Variables, independientes en daño cerebral y, 199 agudeza Teoría de la percepción de las palabras, 311–312
estudios de correlación, 398–399 definidas, visual dinámica, 415–417 pruebas de Reconocimiento de palabras, 194
15, 16, 52, 55, 57 variables dependientes memoria y, 269–273, 291–293 línea normal de Tarea de completar raíz de palabra, 282
y, 15–17, 53 efectos del experimentador como, mirada, 426 Productividad del trabajador, 4
70 identificación, 57 interacción entre, 59–61, Efecto Stroop, 190–195 Carga de trabajo, 417–425, 427–428
284–290 niveles , 52–53, 67 resultados nulos, reconocimiento de palabras, 181, 182
55–56 ejemplos de investigación, 157, 186–187, Ilusiones visuales, 26, 182, 201–204, 205 Pruebas de reconocimiento sí/no, 267
211, 234, 267–268, 303–304, 332–333, 363, 394– Máscaras visuales, 378–379
395, 414 usando varios en un experimento, 58–63, Umbrales visuales, 176–177, 188 Puntajes Z, 456, 464–465, 467, 473
281, 289 manipulación válida de, 55–56
Tarea de selección de tarjetas Wason, 325
IA débil, 340
Ley de Weber, 161, 171, 178–179, 436
Estudio Westinghouse-Ohio, 347–349
Experimentos hipotéticos, 54–55