Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 5
Tema 5
Indice del Captulo 1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE CLAVES CONTEXTUALES ANTECEDENTES237 1.1. Introduccin ...................................................................................................................................................................... 237 1.1.1. El aprendizaje de seal en el condicionamiento instrumental .................................................................................. 237 1.1.2. El aprendizaje de seal como control de estmulos .................................................................................................. 238 1.1.3. Variaciones en las condiciones antecedentes y resultados de generalizacin y discriminacin .............................. 238 1.1.4. Implicaciones prcticas del aprendizaje instrumental sealizado............................................................................. 238 1.2. Tcnicas experimentales .................................................................................................................................................. 240 1.2.1. Tcnicas simples: el refuerzo diferencial .................................................................................................................. 240 1.2.2. El gradiente de generalizacin / discriminacin ........................................................................................................ 240 2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS GENERALIZADOS ................................................ 241 2.1. Procedimientos de estudio de la generalizacin .............................................................................................................. 241 2.2. Tipos de generalizacin .................................................................................................................................................... 242 2.2.1. Generalizacin de estmulo....................................................................................................................................... 242 2.2.2. Generalizacin de respuesta: Moldeamiento o aproximaciones sucesivas .............................................................. 242 2.3. Por qu la generalizacin (teoras explicativas) ............................................................................................................... 243 3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS .................................................................. 244 3.1. Tcnicas simples: Refuerzo diferencial discriminativo ..................................................................................................... 244 3.2. Tcnicas complejas de adquisicin de discriminacin ..................................................................................................... 245 3.2.1. Atenuacin o desvanecimiento del estmulo ............................................................................................................. 245 3.2.2. Comparacin con la muestra .................................................................................................................................... 246 3.2.3. Combinacin de ED y refuerzo secundario: el encadenamiento .............................................................................. 246 3.3. Por qu ocurre la discriminacin (teoras explicativas) .................................................................................................... 247 4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS ....................................................................... 248 4.1. Condiciones durante la adquisicin .................................................................................................................................. 248 4.2. Condiciones de entrenamiento previo en discriminacin ................................................................................................. 249 5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO .................................. 251 5.1. Aplicacin de instigadores y desvanecimiento ................................................................................................................. 251 5.1.1. Dificultades con el refuerzo diferencial ..................................................................................................................... 251 5.1.2. Los instigadores como facilitadores de la discriminacin ......................................................................................... 252 5.1.3. Desvanecimiento de los instigadores ....................................................................................................................... 253 5.1.4. Mtodos aplicados a la reeducacin de las dificultades de aprendizaje .................................................................. 253 5.2. Cambio de un control de estmulo por otro: El cambio fsico de ambiente ...................................................................... 254 6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO ........................................................................................................... 254 6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin aversiva ........................................................... 254 6.1.1. Tipos de aversividad ................................................................................................................................................. 254 6.1.2. Tipos de condicionamiento con estimulacin aversiva ............................................................................................. 255 6.2. Condicionamiento de escape ........................................................................................................................................... 256 6.2.1. Definicin .................................................................................................................................................................. 256 6.2.2. Condiciones o factores en la adquisicin de la conducta de escape ........................................................................ 257 6.3. Aprendizaje de evitacin................................................................................................................................................... 258 6.3.1. Definicin, fases en la adquisicin, tipos y procedimientos ...................................................................................... 258 6.3.2. Condiciones para la adquisicin de la respuesta de evitacin ................................................................................. 261 6.3.3. Por qu ocurre la evitacin (teoras explicativas) ..................................................................................................... 262 6.3.4. Extincin de la respuesta de evitacin ...................................................................................................................... 264 6.4. Castigo ............................................................................................................................................................................. 267 6.4.1. Definicin, caractersticas y lneas de investigacin ................................................................................................. 267 6.4.2. Tipos de castigo: Castigo por aplicacin y por supresin ......................................................................................... 268 6.4.3. Condiciones para la efectividad del castigo .............................................................................................................. 269 6.5. La prdida del control de la accin: Indefensin aprendida ............................................................................................. 273 6.5.1. Concepto y tcnicas experimentales ........................................................................................................................ 273 6.5.2. Efectos o resultados de la indefensin aprendida .................................................................................................... 274 6.5.3. Condiciones para la adquisicin de la indefensin aprendida .................................................................................. 275
- 235 Asignatura: Aprendizaje (6 crditos). Obl. de 2 curso Grado Psicologa, Curso 2010/2011 Profesores: Dr. Agustn Romero Medina (agustinr@um.es) y Ldo. Pedro Jara Vera (pjara@um.es). Dept Ps. Bsica y Metodologa. Univ. de Murcia. Fac. Psicologa; En Aula Virtual Fac. Psicologa en http://avpsi.inf.um.es/moodle/ (usuario: dni sin letra; contrasea: dni sin letra); y en SUMA campus virtual
236
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
6.5.4. Por qu ocurre la indefensin aprendida (teoras explicativas) ................................................................................ 276 6.5.5. Repercusiones aplicadas de la indefensin aprendida ............................................................................................ 278 7. PRCTICAS DE AUTOEVALUACIN DEL TEMA 5 ............................................................................................................. 279
Resumen del tema En cuanto al control de estmulo en el condicionamiento instrumental, en mayor o menor medida, hay variedades de aprendizaje mediante condicionamiento que combinan aspectos del condicionamiento clsico y del instrumental. As, en este captulo se analizan las posibilidades de los EC que se asocian no a EIs sino a respuestas reforzadas, o sea, los estmulos antecedentes de la respuesta instrumental. En lo referente al condicionamiento instrumental aversivo, trataremos en este captulo aquellas tareas y procedimientos de aprendizaje en donde se utilice estimulacin aversiva, sobre todo condicionamiento instrumental. En captulos anteriores estudiamos procesos y tareas de aprendizaje en los cuales los eventos significativos eran positivos (gratificantes o reforzantes). Sin embargo, una gran parte de la conducta que se aprende va dirigida no ya a obtener consecuencias positivas sino a eliminar, reducir o evitar situaciones desagradables. Analizaremos el condicionamiento instrumental con refuerzo negativo (escape y evitacin), tanto en sus aspectos de adquisicin como de extincin. Tambin estudiaremos procedimientos aversivos inhibitorios o que reducen la tasa de respuesta (castigo) y por ltimo, el efecto de la estimulacin aversiva no contingente en lo que se denomina indefensin aprendida.
Lecturas complementarias Referente al control de estmulo, vanse los manuales de Hilgard y Bower (1966; trad. 1976, pp. 562-585), Hulse et al. (1980; trad. 1982, cap. 7), Kimble (1961; trad. 1969; 377-452), Marx (1969; trad. 1976; pp. 297-424), Rachlin (1976; trad. 1979, pp. 456-483), Tarpy (1981; trad. 1986, cap. 9), Wittig (1982, pp 119-136), y el captulo de Arias Holgado, Benjumea y Fernndez Serra (1997). Sobre control de estmulos desde un punto aplicado es til Sulzer-Azaroff y Mayer (1977; trad. 1983) y tambin el captulo de Navarro Guzmn (1994). Para cuestiones de escape, evitacin y castigo hay buenos captulos en Hulse et al. (1980; trad. 1982, pp. 167-207), Mackintosh (1983; trad. 1988, caps. 5 y 6), Pelechano (1980), Rachlin (1976; trad. 1979, caps. 5 y 9), Tarpy (1975; trad. 1977), pp. 125-186), Fernndez Castro (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) sobre indefensin es imprescindible la lectura del libro de Seligman (1975; trad. 1980) y las revisiones de Vazquez-Valverde y Polaino (1982), de Ferrndiz (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) . Tambin es muy ilustrativo el texto de Gray (1988; trad. cast. 1993) y el manual de Klein (1991; trad. cast. 1994, pp. 201-250)
237
1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE CLAVES CONTEXTUALES ANTECEDENTES 1.1. Introduccin 1.1.1. El aprendizaje de seal en el condicionamiento instrumental
En los temas precedentes de aprendizaje mediante condicionamiento hemos analizado situaciones en las que los resultados externos del aprendizaje (cambios conductuales) se hacan depender de las consecuencias estimulares (condicionamiento clsico) o de la accin (condicionamiento instrumental) pero en fenmenos separados y diferentes de aprendizaje. Sin embargo, es un hecho que la conducta no se da "en el vaco" (Mackintosh, 1977; p. 643, trad. esp., 1983) sino en un determinado contexto que est presente en el momento de emitir la respuesta y que puede influir en ella. Estos componentes del contexto que influyen en la respuesta se denomina, en la terminologa conductista, condiciones antecedentes. Estas condiciones pueden ser de dos tipos: motivacionales y estimulares: - Las primeras tienen, como sabemos (ver Tema 1), un valor activador (por ejemplo, es necesaria una cierta privacin de comida para que la rata inicie el condicionamiento) y no se van a tratar aqu. - Las condiciones antecedentes estimulares forman parte del contexto, ambiente o estimulacin previa o concomitante a la respuesta. As, la correlacin accin-consecuencia, necesaria para el aprendizaje de respuestas (condicionamiento instrumental) se convierte en un aprendizaje ms completo si consideramos la correlacin ANTECEDENTES - ACCION - CONSECUENCIA o, lo que es lo mismo, E-R-C (estmulo - respuesta - consecuencia). Es ms completo pues combina condicionamiento clsico y condicionamiento instrumental, o sea,
(ESTMULO CONSECUENCIA) + (RESPUESTA CONSECUENCIA) = ESTMULO RESPUESTA CONSECUENCIA
En el condicionamiento clsico se produca un aprendizaje de seal, es decir, el EC activaba expectativas de consecuencia estimular favorable o desfavorable y con ello desencadenaba ms o menos automticamente la respuesta. Tambin en el condicionamiento instrumental con estmulos discriminativos -es decir, en el aprendizaje de respuestas sealizadas o tambin aprendizaje instrumental sealizado-, se hace un aprendizaje de seal (donde el EC se denomina ahora estmulo discriminativo o ED), pero la seal activa en la memoria no la representacin aislada de la consecuencia sino la representacin conjunta de accin - consecuencia (R-C). El esquema de esta comparacin es el siguiente:
Tipo de condicionamiento Condicionamiento clsico: Condicionamiento instrumental: Seal observable EC ED Representacin activada EI (R-C)
El aprendizaje instrumental sealizado tiene pues dos niveles de complejidad: - Que la respuesta se desencadene tras la aparicin del estmulo antecedente, es decir, que un estmulo ambiental cualquiera se convierta en seal predictiva para R-C. Esto es lo que podramos llamar adquisicin inicial del control de estmulo. - Que, una vez sealizada la conducta, sta se pueda realizar ante otras seales ms o menos parecidas. Se trata de adquirir la sealizacin especfica (discriminacin) o la sealizacin amplia (generalizacin). En cualquier caso, se adquiere control de estmulos: en un caso control de estmul os discriminativos y en otro, control de estmulos generalizados o extensin del control a otros estmulos similares.
238
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
239
presentada en la memoria esta expectativa de relacin triple (estmulo antecedente, accin, consecuencia), la mera aparicin del antecedente servir para desencadenar la accin, convirtindose as en seal o indicio de que la accin tendr una consecuencia positiva y permitiendo una proximidad temporal entre el antecedente y la accin. Como dicen Domjan y Burkhard (1986), es tan habitual el control de estmulos que no pensamos en la cantidad de veces que lo aplicamos y lo raro que resultara -por no decir anormal o patolgico- el mostrar conductas que no estn bajo el control de estmulos. Citan cuatro ejemplos y contraejemplos interesantes: - La conducta de desnudarse para cambiarse de ropa se hace en la intimidad del dormitorio y no en medio de la calle, - se mira la TV si est encendido el aparato y no si est apagado, - se tiene una interaccin cariosa (caricias, besos) con familiares prximos y no con desconocidos, - se grita en un partido de ftbol y no en clase o en la biblioteca. En todos estos casos, la conducta se hace cuando se est en el contexto adecuado y no en otros momentos. Eso es control de estmulos o aprendizaje instrumental sealizado. Pero hay ms ejemplos: Al circular en coche por la carretera, una seal de STOP es ED, antecedente o indicio inmediato de que si se realiza la respuesta (parar) se obtendr una consecuencia (no peligro); en este caso (que aunque es ms bien de evitacin sirve igualmente en este momento), la conexin entre ese estmulo, la respuesta y la consecuencia pudo aprenderse hace tiempo (al estudiar para la obtencin del carnet de conducir, por ejemplo) pero es obvio que la aparicin del estmulo genera inmediatamente una mayor probabilidad de respuesta. El tema es pues de gran importancia terica y sobre todo prctica. La conducta adaptativa se caracteriza, entre otras cosas, por producirse "en el momento oportuno" (Hulse, Egeth y Deese, 1982; p. 206) y el momento oportuno para responder slo lo puede anticipar el sujeto si aparecen las correspondientes seales de ello. Ser ms probable que una accin tenga consecuencias adaptativas cuando se sabe cundo y en qu lugar y en presencia de qu eventos se debe realizar. Por citar ms ejemplos, en clase el alumno no habla (respuesta de "estar atento y en silencio") cuando-el-profesor-expone-eltema (ED), cruzamos la calle (respuesta) cuando el-semforo-est-en-verde (ED), escribimos (respuesta) cuando observamos salir la tinta (ED) del bolgrafo al rozar su punta sobre el papel. Ahora bien, cogemos el telfono (respuesta) cuando omos el timbre (ED) pero no si omos el timbre de la puerta (discriminacin) y decimos "mesa" (respuesta) cuando dicho conjunto de letras lo vemos escrito con maysculas o con minsculas o en cursiva (generalizacin). El situar la accin bajo el control del o de los estmulos es un aprendizaje bsico. En la mayora de situaciones cotidianas es una conducta o hbito sobreaprendido (o aprendido hace mucho tiempo), pero en otras tenemos que activar continuamente estrategias que logren un control del estmulo. Por ejemplo, ante un aparato no muy conocido (video, ordenador, equipo de msica, etc. ), su manejo inicial (respuesta) es dificultoso y debe ponerse bajo el control de estmulo para aprenderlo, y para ello ponemos en marcha distintas estrategias (leer las instrucciones, buscar a un experto y que nos explique el manejo, mtodo de ensayo y error, etc.). Pero hay conductas muy complejas para cuya realizacin se requiere un sofisticado y laborioso control de estmulo que tarda tiempo en establecerse. As, la conducta lectora exige situarse ante un texto escrito, fijar los ojos en los smbolos grficos adecuados y emitir los sonidos correspondientes. El lector maduro tiene un adecuado control de estmulo pero el nio que aprende a leer necesita ayuda (profesores, mtodos especiales de presentacin de estmulos en cartillas, dosificacin de dificultad, etc. ). Hay una serie de mtodos generales desarro llados para instigar inicialmente el hecho de que la conducta se site bajo el control del estmulo. As pues dedicaremos este captulo al aprendizaje instrumental sealizado o control de estmulos, para lo cual estudiaremos los procedimientos de adquisicin, las condiciones, teoras y procesos y tcnicas aplicadas.
240
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
241
Fuerza de la respuesta
E original (a)
E original (b)
En el grfico (a) de la figura anterior, se produce una amplia dispersin de la generalizacin de estmulo como forma de responder a diversos estmulos. En el caso del grfico (b) se produce una respuesta diferenciada y por tanto una escasa generalizacin de estmulo. La representacin grfica (c) es otra forma de exponer grficamente el gradiente de generalizacin. Adems de estos gradientes excitatorios, tambin es posible lograr gradientes inhibitorios o gradiente de extincin. Un ejemplo es el experimento de Honig (1961) con palomas. Tena tres fases: I) Fase preliminar, en la que se estableca una lnea base de adquisicin mediante refuerzo de una respuesta de picoteo de un disco iluminado con 13 longitudes de onda diferentes (de 490 a 630 nm). El animal responda pues ante los 13 estmulos. II) Fase de extincin: ante uno (E ) de los 13 estmulos (570 nm) la respuesta nunca era reforzada. III) Prueba de generalizacin: Se volvan a presentar los 13 estmulos. Los resultados, presentados grficamente en el correspondiente gradiente muestran una funcin en U, siendo el pico inferior la respuesta ante E .
2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS GENERALIZADOS 2.1. Procedimientos de estudio de la generalizacin
El procedimiento bsico es tambin de refuerzo diferencial, midiendo las tasas de respuesta que se dan tras cada estmulo, antes y despus de ser reforzada la respuesta. Se trata pues de comparar tasas de respuesta en presencia de diferentes estmulos. Hay dos grupos de tcnicas diferentes: las que suponen presentar estmulos diferentes a los mismos sujetos y las que hacen presentar el mismo estmulo a distintos grupos de sujetos: - El primer tipo de tcnica es la del estmulo repetido, segn la cual se presentan estmulos distintos (pero similares al condicionado) en orden aleatorio. Tiene el inconveniente de que la respuesta ante uno de los estmulos puede verse muy influida por las consecuencias de las respuestas ante los otros. - El segundo tipo de tcnica se llama tcnica del estmulo nico: se divide al grupo experimental en subgrupos y cada uno de ellos recibe slo un estmulo (diferente para cada grupo); se comparan las tasas de respuestas de los distintos grupos entre s.
242
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
243
Se basa en el refuerzo de cada respuesta que se parezca o aproxime a una "respuesta terminal" o conducta objetivo seleccionada de antemano. Se emplea el moldeamiento o mtodo de aproximaciones sucesivas cuando la respuesta terminal no se da habitualmente en el repertorio comportamental del sujeto. As, si uno es reforzado por sonrer, aumenta la frecuencia de la risa y quizs de otras respuestas tales como la conversacin. O sea, la alteracin en la frecuencia de una respuesta puede influir de forma inadvertida en otras. En resumen el esquema que corresponde a ambos tipos de generalizacin sera el que se muestra en la Figura 2.
GENERALIZACION DE ESTIMULO E1 E1 E2 E3 R1 Eref GENERALIZACION DE RESPUESTA E1 R1 Eref R1 R2 R3
R1
E1
244
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
rm rm rm rm
em em em em R1
3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS 3.1. Tcnicas simples: Refuerzo diferencial discriminativo
Segn Millenson y Leslie (1979, pp. 247-248), el paradigma bsico de discriminacin consta de una respuesta (R) y dos condiciones de estmulo (ED y E ). La R es reforzada en presencia de uno de los estmulos, el ED, y no es reforzada en presencia de la otra condicin estimular, el E (con lo cual se extinguir dicha R). El resultado es que la probabilidad de responder ante E D se hace mayor que ante E . Dichas condiciones podran representarse del siguiente modo: ED - R E -R / Eref no Eref
donde = "es seguida por"; / = "no hay consecuencias programadas". E se usa tambin para denotar condiciones no slo de ausencia de refuerzo (extincin) sino de menor refuerzo que para ED. El refuerzo diferencial tiene en el contexto experimental dos variantes: La tcnica de discriminacin simultnea y la de discriminacin sucesiva: TCNICA DE DISCRIMINACIN SIMULTNEA Se presentan los dos estmulos (ED y E ) al mismo tiempo y se refuerza la eleccin correcta. Es la tcnica usada por Lashley (1930) en su trampoln de saltos con ratas: La rata salta a una u otra de las puertas, si la eleccin es correcta se abre la puerta y el animal llega a la comida, si no lo es, al saltar no se abrir la puerta. En la Figura 4 podemos apreciar dicho dispositivo. DISCRIMINACIN SUCESIVA Se presentan sucesiva y alternativamente ambos estmulos y se refuerza la respuesta slo ante E D y no ante E . Tanto en el caso de la discriminacin simultnea como de la sucesiva, se consigue un aumento de la tasa de respuesta en presencia de ED y un cese progresivo y desaparicin de la respuesta ante E . As es como el sujeto ha aprendido a dar respuesta selectiva ante un estmulo, o lo que es lo mismo, ha aprendido a "discriminar" dicho estmulo, lo distingue de otros, da ante l una respuesta distinta que ante otros estmulos.
245
246
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
rezca ninguna respuesta ante E (no hay frustracin al no haber errores, al no darse respuestas que no vayan seguidas de recompensa) y se puede llegar a un grado de discriminacin muy elevado. En el mbito aplicado la utilizacin de desvanecimiento es fundamental cuando se aplican instigadores (vase apartado 5).
1 se presenta:
2 se presentan:
d p q b h b
Diferenciacin de la muestra
1 se presenta:
Estmulo de muestra
2 se presentan:
b d b b b
Figura 5: Ejemplos de aplicacin de tcnicas de igualacin y diferenciacin a la muestra
247
de conductas nuevas. Es un procedimiento basado en el concepto de refuerzo condicionado o secundario, ya explicado en el Tema 4. El encadenamiento es un procedimiento que consiste en ordenar secuencias o cadenas continuas de estmulos y respuestas mantenidos en unin por estmulos que tienen una doble funcin: como refuerzo secundario y como ED. Una cadena de este tipo est compuesta de eslabones, cada uno de los cuales consta de una secuencia de ED - RESPUESTA - REFUERZO CONDICIONADO. Se exige tambin que el primer elemento de la cadena sea un ED, que el resto de estmulos discriminativos sean a su vez refuerzos condicionados y que el ltimo refuerzo de la cadena sea primario. Un ejemplo sera el siguiente: Un chimpanc opera una mquina mediante la cual recibe una ficha que cambia a continuacin por alimento. La cadena sera la que encontramos en la Figura 6.
E1D R1 ED Ref. cond. 1
(ficha)
(mquina)
(operar mquina)
R2
(cambiar ficha por uva)
Eref
(uva)
Otro ejemplo sera la secuencia de respuestas para ir a un restaurante: 1) ED (llamada telefnica de un amigo, hora del da, hambre). 2) Varias respuestas secuenciadas (levantarnos, abrir la puerta, salir de casa, entrar al coche, conducir, aparcarlo, entrar al restaurante, sentarnos, leer el men, pedir la comida, comerla). El estmulo ambiental que sigue a cada respuesta da ocasin a la siguiente respuesta de la cadena. 3) La cadena total est mantenida por la comida que finalmente comemos. As pues en resumen, el encadenamiento sigue los siguientes pasos: 1) Presentacin de un ED 2) Respuesta en presencia de ED 3) Aparicin consiguiente de otro E que es refuerzo condicionado respecto al paso anterior y ED para... 4) ... una nueva respuesta 5) Estmulo nuevo que es refuerzo condicionado y ED ... etc. ... n) El ltimo estmulo que forma la cadena es un reforzador primario o innato. Para un uso aplicado de este procedimiento vase el libro de Sulzer-Azaroff y Mayer (1977).
248
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
b) Teora atencional. Es original de Sutherland y Mackintosh (1971). Segn dicha teora, el aprendizaje discriminativo implica dos procesos discretos: el refuerzo de la atencin a una o ms dimensiones relevantes del estmulo y la concesin de una respuesta particular al estmulo relevante. El sujeto aprende dos cosas durante los experimentos de discriminacin: 1, aprende a atender a las dimensiones particulares del ambiente sobre la base de que las consecuencias de dicha atencin predicen correctamente importantes eventos (posible refuerzo ulterior a la respuesta); y 2, aprende a responder en funcin del refuerzo.
249
La habilidad para responder diferencialmente a dos estmulos est limitada por las capacidades perceptivas del sujeto para distinguir entre ambos. De este modo, si los estmulos son demasiado parecidos como para que los pueda distinguir un determinado organismo, puede llegarse a lo que desde Pavlov se viene llamando "neurosis experimental" (al exigir discriminaciones entre estmulos con propiedades cada vez ms similares) con sntomas en perros debidos a la incapacidad de discriminacin, tales como angustia, confusin, etc. El experimento tpico de la escuela de Pavlov -Shenger-Krestovnika (1921; cit. por Gray, 1988; 1993, trad. cast., p. 152)- consista en mostrarle al perro un crculo (EC) y luego darle comida, obteniendo as una RC de salivacin; se le muestra tambin una elipse pero no se le da comida y no se obtiene RC; cuando el cociente de los ejes de la elipse se redujo a 9:8, el perro no diferenciaba entre el crculo y la elipse; durante tres semanas su ejecucin fue correcta en otros casos pero luego cambi, cometiendo errores en discriminaciones ms simples e incluso mostrando signos de angustia (ladridos, agitacin, etc.). e) Informacin estimular Nos referimos con ello a las propiedades informativas del estmulo, es decir, si el estmulo produce informacin sobre la recompensa o la no recompensa. Cuanto mayor valor informativo tenga el estmulo mejor se producir la discriminacin. f) Aprendizaje observacional O sea, la oportunidad para el aprendiz de observar a otro sujeto (el modelo) cmo ejecuta la respuesta ante el estmulo. Si se da esta oportunidad, mejor se producir el aprendizaje discriminativo.
250
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
c) Transferencia del entrenamiento en discriminacin Se trata de situaciones en las cuales el aprendizaje de una tarea influye en la adquisicin posterior de alguna otra. Se ha demostrado que si se aprende una discriminacin relativamente fcil antes de aprender otra relacionada ms difcil, la discriminacin facilitar la adquisicin de la segunda tarea. d) Entrenamiento previo ED - E : El fenmeno de desviacin del vrtice Tambin denominado "cambio de pico" (peak shift), fue descubierto inicialmente por Hanson (1959) y se refiere al hecho de que tras un entrenamiento en discriminacin seguido por un entrenamiento inhibitorio con E , la fuerza de una respuesta puede desplazarse lejos de la direccin de un E y ms all de un ED original, aun cuando el ED contine manteniendo sus propiedades. En la Figura 8 podemos apreciar que las respuestas reforzadas ante el ED y de extincin al E generan un gradiente de generalizacin del estmulo que no es simtrico, teniendo la mayor parte de la fuerza de respuesta desplazada a lo largo de la dimensin del estmulo en el sentido de ED y alejndose de E . O sea, al ir hacia la izquierda de la dimensin de estmulo, en la Figura 8 se observa que se eleva la curva para la fuerza neta de respuesta, alcanzando un pico no en el ED original sino en un punto situado a la izquierda de l. Dicho desplazamiento se obtiene despus del adiestramiento de discriminacin que incluye un reforzador diferencial a los estmulos ED y E . Implica: 1 entrenamiento con ED (ED- R- Ref), 2 entrenamiento con E (E - R- no Ref) y 3 vuelta a ED mayor R ante ED+n Citemos un ejemplo (Wittig, 1982, p. 125) sacado de la poltica: supongamos que un hombre apoya a una candidata que es ligeramente ms conservadora que el candidato que normalmente ha apoyado en otras ocasiones. Al salir elegida dicha candidata, los proyectos de ley por los cuales trabaja y vota a favor, son en extremo conservadores -hecho que sirve como una fuerte condicin para el votante-. En las siguientes elecciones, el hombre puede cambiar y no volver a su posicin original sino ir mucho ms all apoyando a un candidato a quien inicialmente hubiera juzgado muy liberal. Otro ejemplo de tipo deportivo: Un habitual seguidor del Real Madrid traslada sus simpatas al Atltico de Madrid. Tras el fracaso futbolstico de ste ltimo vuelve a simpatizar ms que nunca con el equipo blanco.
Gradiente en la prueba posterior al establecimiento de las propiedades del estmulo
Gradiente original
ED
Dimensin del estmulo Figura 8: Representacin grfica del fenmeno de desviacin del vrtice.
Debe notarse que el fenmeno de la desviacin del vrtice no se refiere a una intensificacin en la magnitud de la respuesta debido a la experiencia previa, lo cual nos remitira al fenmeno de contraste ya estudiado en el captulo anterior. En este caso, lo que se produce es una traslacin de la respuesta
251
en el espectro de los potenciales estmulos discriminativos, una radicalizacin de la respuesta original del sujeto en una direccin debido a una experiencia frustrante (no reforzada) cuando coyunturalmente el sujeto da respuesta ante otros estmulos situados en la direccin contraria del espectro. e) Discriminacin de relaciones: La transposicin La transposicin es la capacidad que tienen los organismos para llevar a cabo discriminacin de relaciones. El E de una prueba pasa a ser ED de la segunda. El experimento clsico consiste en presentar dos crculos, el mayor hace de ED y el menor de E . Khler (1925) utiliz pollos para que discriminaran entre dos superficies grises circulares (una ms grande que la otra), de tal modo que se aprenda a discriminar entre ellos (reforzando cuando se responda ante el crculo mayor). A continuacin, se presentaba el crculo menor junto con otro ms pequeo, haciendo reforzar al sujeto ante el mayor de ambos (que en la primera prueba era el E ), como vemos en la Figura 9. 1 Prueba ED E ED E 2 Prueba
De este modo se aprende a responder a la relacin (en este caso "ser menor que") entre estmulos, prescindiendo de los valores absolutos de los mismos. En situaciones de la vida real, el fenmeno de transposicin se produce, por ejemplo, cuando el entrenador de un equipo de baloncesto coloca como pivot titular al jugador "ms alto" de la plantilla. El criterio de seleccin es por tanto comparativo y el jugador ms alto en un momento dado puede no serlo en la temporada siguiente.
5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO 5.1. Aplicacin de instigadores y desvanecimiento 5.1.1. Dificultades con el refuerzo diferencial
Sabemos pues que existe control de estmulo cuando en presencia de un estmulo antecedente particular hay mayor probabilidad de que ocurra una respuesta particular. Est claro que lo que se aprende en este caso no es una respuesta nueva sino a producirla en las condiciones apropiadas, en cuyo caso estas condiciones (estos estmulos antecedentes) provocan esa respuesta. Es decir, el estmulo antecedente es significativo para el sujeto y, a la manera del EC, activa en el aprendiz la expectativa de que determinada respuesta ser reforzada en su presencia. No son pues los estmulos los que contr olan al sujeto (a los estmulos no se le pueden atribuir funciones humanas) sino el sujeto quien controla pues la situacin en funcin del significado atribuido al estmulo antecedente. El control de estmulo generalmente se adquiere con procedimientos de refuerzo diferencial. Para que ste sea eficaz en el control de estmulos, deben darse una serie de condiciones ptimas:
252
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
- debe ocurrir la respuesta deseada, - los estmulos esenciales deben controlar alguna conducta de atencin del sujeto, - los dos sucesos (estmulo y atencin focalizada) deben ocurrir simultneamente para que se suministre el refuerzo. No obstante, hay veces en que no resulta efectivo. No es fcil que el estmulo controle (adquiera el significado pertinente para provocar...) la respuesta y ello puede ser debido, segn Sulzer-Azaroff y Mayer (1977), a varios factores: - porque la respuesta no se hallaba en el repertorio de respuestas del sujeto (por ejemplo, en el nio que no sabe leer, al ver la letra p (ED) no sabr pronunciarla), - porque la respuesta est bajo el control de otros estmulos o el estmulo controle otras respuestas (en nios pequeos se dan muchos ejemplos: responde pap al ver personas con gafas, al ver un peridico a mano le induce la respuesta de despedazarlo, al ver a su madre coger el bolso de paseo le motiva a levantarse e irse a la puerta para salir, etc.), - porque el estmulo sea difcil de percibir por problemas sensoriales o motores, - porque la respuesta haya tenido en el pasado un control de estmulo diferente (por ejemplo, con un nuevo procesador de textos, centrar un ttulo se hace combinando las teclas Ctrl y T, pero con el anterior procesador se haca con Alt + C). Por todo ello, es preciso utilizar mtodos adicionales, sobre todo instigadores y desvanecimiento posterior.
253
c) Gua fsica. Consiste en guiar el movimiento correcto de la respuesta y se utiliza cuando fallan los anteriores. En el ejemplo citado, el maestro cogera la mano del nio y se la movera para escribir la letra "a". Estos tres instigadores se pueden ordenar en una escala de mayor a menor intrusividad, es decir, en cuanto al menor o mayor grado de importancia del instigador o probabilidad de que sea seguido por el aprendiz. El ms intrusivo es la gua fsica, le sigue la demostracin y por ltimo las instrucciones verbales. d) Otros tipos de instigadores. Otros instigadores muy usados en la prctica son los perceptivos, por ejemplo, para lectura o escritura, magnificacin de los rasgos crticos de estmulo, el punteado de las letras en los cuadernos de caligrafa, etc. En la enseanza o en procedimientos de adiestramiento, se suele comenzar por los instigadores menos intrusivos. Por ejemplo, en una tabla de gimnasia, el monitor da las explicaciones pertinentes sobre los movimientos que han de hacer los alumnos. Si estos instigadores no son vlidos para que se logre el control de estmulos, entonces habr que recurrir al siguiente: la demostracin (el monitor realiza el movimiento o el ejercicio tal y como lo deben hacer sus alumnos). Si tampoco funciona entonces habr que recurrir a la gua fsica (el monitor coge el brazo o la pierna del sujeto y se la mueve en la direccin correcta). Normalmente se suelen combinar los instigadores (instruccin verbal con demostracin, etc.). En cualquier caso, es importante que los instigadores se vayan retirando mediante desvanecimiento, tal y como se explica en el siguiente apartado.
254
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
Se trata pues de convertir el rea de estudio en el nuevo estmulo discriminativo de la conducta de estudiar. En esta misma lnea, puede interesar que la respuesta no est controlada por muchos estmulos sino por uno en particular. El obeso que come mientras ve la televisin o escucha la radio, o habla con otros, etc. debera comer exclusivamente en la mesa del comedor, a ciertas horas, sin televisin ni radio, etc. En definitiva, estos planteamientos permitiran al sujeto un mayor autocontrol y no tanta dependencia de los estmulos y de personas o servicios que proporcionen instigadores.
6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO 6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin aversiva 6.1.1. Tipos de aversividad
El condicionamiento, sea clsico o instrumental, se realiza muchas veces con estmulos aversivos. Un estmulo aversivo es lo que en lenguaje cotidiano llamamos estmulo "molesto", "incmodo", "doloroso", "desagradable", "nocivo", etc., es decir, su aplicacin al sujeto tiene para l consecuencias negativas. La aversividad es pues cualquier evento que produzca una percepcin de malestar o desagrado. Proponemos cinco criterios para clasificar o caracterizar los eventos aversivos: 1) Criterio estimulacin aversiva primaria secundaria: Una cosa es la estimulacin que produce dolor o malestar fsicos directos y otra las seales o EC o ED previamente asociados a estimulacin aversiva primaria (enchufes, fuego en la cocina, dedos puestos en el quicio de la puerta, nube oscura que amenaza lluvia, etc.).
255
2) Criterio estimulacin aversiva directa indirecta: Una cosa es la aplicacin directa de estimulacin aversiva primaria que produzca dolor o malestar fsico (descarga elctrica en el animal, agresin, tortura, malos tratos fsicos, hambre, sed, enfermedad, problema irresoluble, etc.) y otra es la ausencia del refuerzo esperado. 3) Criterio contingencia o dependencia estimulacin aversiva respuesta: Se trata de la contigidad o proximidad espacio temporal de una con respecto a la otra, en contraposicin a una relacin contingente o no necesaria, es decir, sin aparente relacin entre un evento y otro. En este caso de la no dependencia, tenemos la situacin de indefensin aprendida 4) Criterio orden temporal de ocurrencia entre estimulacin aversiva respuesta. Esto ocurre sobre todo cuando dependencia entre estimulacin aversiva y respuesta, y tenemos dos claras opciones: - Eav R (primero estimulacin aversiva y despus la respuesta): Si primero se aplica estimulacin aversiva y su cese es contingente con (dependiente de) la aparicin de una respuesta, entonces aumentar la probabilidad de ocurrencia de dicha respuesta. Segn sto, y siguiendo la tradicin skinneriana, esta situacin conlleva refuerzo negativo (refuerza el cese -contingente a la respuesta- de la estimulacin aversiva, lo cual fortalece y mantiene la respuesta) y es tpico paradigma de escape. Estas condiciones de refuerzo negativo las podramos simbolizar del siguiente modo: Eav - R No Eav (Ref. neg.) - R Eav (primero respuesta y despus estimulacin aversiva): Si primeramente aparece la respuesta y tras ella se aplica contingentemente estimulacin aversiva, entonces disminuir la probabilidad de ocurrencia o incluso se eliminar la respuesta. Esta acepcin sigue la tradicin de Thorndike y ms tarde se denomin, para distinguirlo del anterior, estimulacin punitiva y se inserta en el paradigma de castigo. Se simbolizara: R Eav 5) Criterio efectos en la respuesta: En psicologa del aprendizaje, un estmulo aversivo se define en funcin del efecto que produce en la conducta. En general, hay tres efectos en la conducta relacionada con dicha estimulacin: - Incremento de la tasa de respuesta por refuerzo negativo. Suele ocurrir en situaciones Eav - R y por tanto en casos de escape y evitacin - Disminucin de la tasa de respuesta por estimulacin punitiva contingente. Se trata de situaciones R - Eav y es el caso del castigo. - Aparicin de alteraciones conductuales, emocionales o conductuales, ligadas a la aplicacin de estimulacin punitiva contingente y sobre todo no contingente. El efecto de esta modalidad se conoce desde Seligman (a mediados de los 60) como indefensin o impotencia aprendida (difcil traduccin del ingls learned helplessness), en la cual el sujeto recibe estimulacin aversiva inescapable. Sera una situacin del tipo: R - Eav no conting.
256
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
cuarto la estimulacin punitiva no es contingente a la respuesta. Los tres primeros pueden incluir diversas variantes, sobre todo si se utilizan estmulos discriminativos. En cuanto a la indefensin aprendida, algunos manuales de aprendizaje lo citaban como una variedad del castigo (Pelechano, 1980), aunque desde hace tiempo (Wittig, 1982; Hulse et al., 1982) lo consideran como otro paradigma ms de aprendizaje con estimulacin aversiva. Algunos han tratado tambin la aversividad resultante de suprimir o disminuir un reforzador. En estos casos se habla del castigo por supresin, extincin simple y entrenamiento de omisin. Aunque estos dos ltimos tipos no los trataremos aqu, los esquemas de las Tablas 1 (adaptada de la expuesta en el Tema 4) y 2 nos resumen todo esto.
Tabla 1: Tipos de condicionamiento con estimulacin aversiva en funcin de los tipos de consecuencias sobre la conducta y del tipo de relacin R-C. CONSECUENCIAS / resultados POSITIVAS N E G A T I V A S (aversivas) adquIsIcIn extIncIn Por cese de Por aplicacin Por omisin del estimulacin aversiva Reforzador (ref. negativo) - Escape - Castigo por - Castigo por - Evitacin aplicacin supresin (cast. positivo) (cast. negativo) - Indefensin aprendida
SI Relacin de contingencia R - C
NO
Tabla 2: Presencia de los criterios de clasificacin de los eventos aversivos en los tipos de condicionamiento con estimulacin aversiva (Eav). Escape Evitacin Castigo por Castigo por Extincin Indefensin Criterios aplicacin supresin aprendida Eav. Primaria Si Si Si Eav. Secundaria Si Si Eav. directa Si Si Si Si Eav. indirecta Si Si Eav. contingente Si Si Si Si Si Eav. no contingente Si Orden temp. Eav.-R Si Si Orden temp. R-Eav. Si Si Incremento de R Si Si Disminucin de R Si Si Si Si Alteraciones de R Si Si
Ms en detalle, supondra una secuencia con dos fases seguidas: 1) Una R1 provoca la Eav y la consecuencia 1 de dao o dolor 2) Una R2 de escape provoca una consecuencia 2 de cese de Eav y alivio
257
En el futuro, el sujeto aprende a no hacer R1. Es un tipo de aprendizaje que se logra con rapidez y es muy adaptativo. Todos escapamos de circunstancias aversivas y procuramos que esa experiencia desagradable no nos vuelva a ocurrir: un nio aprende a no tocar una estufa encendida si alguna vez se quem con ella, o sea R1 (tocar estufa encendida) Eav (calor fuerte) Consecuencia 1 (de dao o dolor) R2 escape (retirar mano) Consecuencia 2 de cese Eav (alivio). Ms ejemplos: una persona que se encuentra en un ambiente donde hay excesivos ruidos presenta comportamiento de escape simplemente alejndose del lugar donde se emite el ruido; si empieza a llover y te mojas rpidamente abres el paraguas (y si no lo tienes te resguardas en un portal), con lo cual cesa la estimulacin aversiva, la respuesta tiene una consecuencia positiva y se refuerza para el futuro. Los procedimientos y tcnicas experimentales ms utilizados en la investigacin de la conducta de escape aparecen resumidos en el Cuadro 1.
En humanos
258
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
Con humanos la respuesta elegida suele ser de tipo manipulativo (a menudo enmascarada la tarea con problemas de discriminacin) y como estimulacin aversiva, adems de la descarga elctrica de baja intensidad, se utilizan ruidos fuertes y molestos o incluso alguna tcnica similar a las del castigo por supresin de reforzador (vase el apartado correspondiente de este captulo).
Figura 10: Lanzadera o caja de saltos, en versin antigua (a) o actual (b)
259
un zumbido de aviso (EC) y al estar el agua electrificada sufran una descarga elctrica (EI). Lgicamente la retirada del dedo (R de evitacin) era inmediata y en sucesivos ensayos el inicio del EC permita no sufrir EI. Parece condicionamiento clsico pero no lo es puesto que en aqul el EI ocurre independientemente de la respuesta mientras que aqu la respuesta instrumental impide su aparicin. La diferencia entre escape y evitacin estara en que en sta ltima la respuesta pospone o elimina una estimulacin aversiva que todava no ha ocurrido. En la conducta de escape siempre se aplica estimulacin aversiva al sujeto mientras que en la evitacin basta con la presentacin de un E D (EC en trminos de condicionamiento clsico) que de alguna manera evoque (por asociacin previa EC-EI aversivo) la estimulacin aversiva. Adems, en la situacin de escape, la supresin de estimulacin aversiva ocurre tan pronto como se emite la respuesta, mientras que en la evitacin se previene la aplicacin de estimulacin aversiva mediante la respuesta. As, por ejemplo: - un baista se aplicar bronceador (R) para evitar quemaduras en la piel (Eav) por el sol al llegar a la playa (ED); - los conductores obedecen las seales de trfico para evitar accidentes o multas; - ED (da nuboso): R (llevar sombrilla) No Eav (evitacin de la lluvia). O sea, no es necesario que nos mojemos por la lluvia al salir de casa (Eav) para que cojamos la sombrilla (R); basta con que veamos el da muy nuboso (ED). As pues, en la evitacin tenemos seales del entorno que por aprendizaje previo son aversivas; se podra decir, por tanto, que la evitacin es una conducta motivada por el miedo (Gray, 1988; trad. cast. 1993, p. 132). El sujeto aprende a darle un significado atemorizante a determinadas seales del entorno. Podemos decir que en el paradigma de evitacin, el sujeto "escapa" o reacciona no ante la presencia de la estimulacin aversiva en s, sino ante los estmulos discriminativos (EC) que sealizan la posterior presencia de estimulacin aversiva (EI), y por tanto el miedo (RC) provocado por esos estmulos sealizadores es la emocin que motiva la conducta de evitacin. Al emitir esa conducta, el miedo se reducir, lo cual supone un refuerzo negativo para esa conducta de evitacin. Hay que notar que el miedo tiene un doble valor aqu: es una respuesta del sujeto condicionada a una determinada situacin estimular, pero tambin es en s un estmulo aversivo del que el sujeto hace por escapar (con lo cual evita el estmulo posterior que el miedo anticipa). Aunque se explica ms adelante en la teora bifactorial de Mowrer, parece evidente que el establecimiento de la conducta de evitacin necesita dos fases: - Una fase previa, en la que un determinado estmulo adquiere un significado aversivo de algo que antes no tena. Puede ser un escape sealizado, esto es, tener la experiencia del par ED- Eav, o, si se quiere en la terminologa del condicionamiento clsico, la experiencia EC-EIav; o puede ser una respuesta castigada (R- Eav). Si es el primer caso, tendremos la evitacin activa (hago algo tras la seal para evitar Eav) y si es el segundo, la evitacin pasiva (no vuelvo a hacer R para evitar Eav), como analizaremos enseguida. En cualquier caso, es caracterstico de la evitacin que se adquiere con muy pocos ensayos de este tipo, incluso basta con un aprendizaje vicario u observacional. - La fase propiamente de evitacin, en la que el evento (estmulo o respuesta) con significado aversivo, por s solo y sin necesidad de que aparezca la estimulacin aversiva, produce la respuesta de evitacin. Se han descrito (Gray, 1988; Klein, 1991) dos tipos de aprendizaje de evitacin: la evitacin activa y la pasiva. a) Evitacin activa
260
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
Se trata de realizar una conducta que, ante la correspondiente seal atemorizante, impida o prevenga la estimulacin aversiva. Abrir el paraguas ante seales de lluvia, el nio que hace los deberes para no suspender el examen, pagar el alquiler para evitar que nos echen del piso, caminar por la acera para que no me atropellen los coches, etc. El sujeto aprende pues un comportamiento nuevo: realizar una determinada accin para no tener una experiencia desagradable. Una descripcin muy interesante es la de Gray (1988; trad. cast 1993, p. 134) poniendo ejemplos de animales: El animal quiere que se le deje en paz (...) pero alguien (el domador de circo, el psic logo experimental) desea que adquiera alguna nueva forma de conducta. El domador somete al animal al estmulo temido y retira ese estmulo slo si el animal realiza la conducta deseada. En otras palabras, es castigado por hacer cualquier otra cosa que no sea la respuesta deseada. Es como si le advirtiera al animal: Haz esto, o si no.... En trminos coloquiales, la evitacin activa sera saber lo que hay que hacer para no sufrir algo malo. b) Evitacin pasiva Aqu la conducta impide exponerse a un acontecimiento aversivo. Un ejemplo de Klein (1991; trad. cast. 1994, p. 211) es muy ilustrativo: Imagnate que recibes una carta del dentista recordndote que debes realizar un chequeo semestral (...); no respondiendo a la carta, evitas al dentista. Es decir, se abandona un tipo determinado de actividad porque tenemos experiencia de que va seguida de una consecuencia desagradable. Siguiendo con ejemplos de animales, Gray (op. cit.) dice que, en la evitacin pasiva, el animal quiere hacer algo y esta accin le conduce a ponerse en contacto con el estmulo atemorizante. La nica forma de evitar el estmulo temido es abandonar la conducta deseada. Por ejemplo, un animal hambriento busca comida, pero si toca la comida puede que se le aplique una descarga elctrica. Hay pues dos fases: - Fase previa: Tras ED se produce la respuesta y entonces recibe estimulacin aversiva (es pues una experiencia previa de castigo) - Fase actual: Al aparecer ED entonces el sujeto no produce la respuesta Como dice Gray, es como si se advirtiera al animal: No hagas eso, o si no.... Tambin en trminos coloquiales, la evitacin pasiva consistira en saber lo que hay que dejar de hacer para no sufrir algo malo (aunque me guste). La evitacin pasiva es pues la consecuencia posterior de una conducta previamente castigada. Una respuesta que es castigada, en el futuro ser evitada aprovechando las seales externas (ED ) o internas (recuerdo de la experiencia) que conducen a ella. Sera una secuencia que esquemticamente se podra expresar: (ED ) Expectativa de R-Eav No realizacin de R
El mismo autor sugiere que la evitacin pasiva en realidad es un conflicto de aproximacin - evitacin. En efecto, el sujeto est solicitado, mediante seales procedentes del medio, por dos formas de conducta incompatibles entre s: - aproximarse a un objeto o estmulo deseado, interesante o apetecible - mantenerse alejado de l (pues hay experiencia previa de que produce algo aversivo) Volviendo al ejemplo del dentista: Quiero ir al dentista para solucionar los problemas que tengo con mi dentadura (aproximacin) pero no voy a ir pues me da miedo, hace dao, etc. (evitacin). Dos tipos de procedimientos experimentales muy utilizados, al menos en la evitacin activa han sido: la evitacin discriminativa de ensayos discretos y la tcnica de evitacin de Sidman o de operante libre. El Cuadro 2 describe detalladamente estas tcnicas
261
1) Evitacin discriminativa de ensayos discretos En este tipo hay un ED por el cual la ejecucin de la respuesta pospone o evita la estimulacin aversiva. En el laboratorio se us por primera vez en un experimento de Brogden, Lipman y Culler en 1938, en el cual una seal discriminativa (ED) precede a cada shock. Despus, la respuesta durante el aviso ED impide la aplicacin de la descarga. Las respuestas durante el intervalo entre ensayos no tienen efecto. Cada shock ser evitado si una respuesta ocurre durante cada E D (el cual desaparece tambin al emitirse la respuesta). La Figura 11 nos muestra un diagrama de dicho procedimiento.
R
ED ED ED ED ED
ED
Shock
Figura 11: Diagrama del procedimiento de evitacin discriminativa.
En general, con la evitacin discriminativa se ha seguido el procedimiento experimental de ensayos discretos o separados: un ensayo comienza siempre con la aparicin de ED y termina con la emisin de la respuesta. Normalmente con animales (perros, ratas) se usa la caja de saltos. El experimentador puede exigir al animal que salte alternativamente de un compartimiento a otro para evitar el shock (procedimiento llamado "evitacin de doble direccin" o de vaivn) o bien puede exigir simplemente un salto en una direccin y, una vez ejecutado el salto, sacar al animal del segundo compartimiento para volver a colocarlo en el primero al comienzo del ensayo siguiente ("evitacin en una direccin"). 2) Evitacin tipo Sidman o de "operante libre". Este tipo de evitacin la inici experimentalmente Sidman en 1953 con el procedimiento que lleva su nombre. En este caso, la estimulacin aversiva se aplica a intervalos regulares (segn un programa IF) a no ser que ocurra la respuesta, con lo cual se pospone dicha estimulacin aversiva durante cierto intervalo de tiempo (tambin fijo). Si la siguiente respuesta ocurre antes de que finalice dicho intervalo R-Eav, se vuelve a posponer el Eav, y as sucesivamente es como evitar la estimulacin aversiva. En este procedimiento, la seal discriminativa es el intervalo fijo, la pauta regular de aparicin de la estimulacin aversiva.
262
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
5) Respuestas de defensa especficas de especie: Se hicieron experimentos donde se variaba el tipo de respuestas que deba dar el animal para evitar la estimulacin nociva, y se encontr que las respuestas de evitacin exigidas deban ser compatibles con el tipo de estimulacin y acordes con las respuestas naturales en la especie animal que aprende, pues de otra manera no eran aprendidas. Bolles y otros (Bolles, 1969; D'Amato y Schiff, 1964; Meyer, Cho y Weseman, 1960) fueron los autores de este tipo de experimentos y llegaron a esta misma conclusin: no todas las respuestas son igualmente condicionables. Las ratas, en una situacin aversiva aprendan bien una respuesta de salto o de carrera, pero no una conducta esttica (por ejemplo, permanecer sentadas sobre las patas traseras). Para explicar este fenmeno contrario a las leyes tradicionales del aprendizaje (vase la ley de equipotencialidad, en el Captulo 1), Bolles acu el trmino de reaccin de defensa especfica de especie (RDEE), segn la cual, un animal aprende una respuesta de evitacin slo si dicha respuesta es parte de las reacciones defensivas naturales innatas de dicho animal. El concepto de preparacin (preparedness), acuado por Seligman (1970), viene a incidir en el mismo tema. Con ello se quiere indicar que un animal puede estar preparado, no preparado o contrapreparado para aprender determinadas respuestas. La contrapreparacin se manifiesta cuando el organismo muestra una resistencia extrema a aprender algo (la conducta esttica de las ratas, antes mencionada). Se trata de un concepto operativo que se puede medir a travs del nmero de ensayos que se necesitan para lograr que esa respuesta sea aprendida. 6) Adquisicin de respuestas de evitacin mediante acoplamiento con otras y/o con refuerzos : Sobre todo en el mbito de la interaccin social humana, es muy frecuente encontrar situaciones en las cuales determinadas conductas de evitacin de unos sujetos se potencian por las conductas de evitacin de otros. Por ejemplo pensemos en una interaccin entre dos sujetos, A y B, que sigue el siguiente esquema: Sujeto A: Sujeto B: E av. R Eav. E ref. neg. R ev.
Con la prctica, R ser R ev.
Un ejemplo tpico se da en la interaccin entre nios y padres: Lo que para un sujeto A (beb) no es ms que emitir una conducta de llanto por un estmulo aversivo interno suyo (tiene molestias digestivas, etc.), para un sujeto B (padre o madre) esa respuesta a su vez es un estmulo aversivo que provoca en l: (1) una actividad mental encubierta de formacin de hiptesis, atribuciones, etc. (por qu ll ora?: porque no ha dormido, porque tiene hambre, etc.), y (2) una conducta manifiesta de evit acin (alejarse del nio, llamar a la madre, mecer la cuna, etc.) que hace de refuerzo negativo para el sujeto B si cesa de llorar y as consolidarse su recuerdo procedimental y/o declarativo (para que no llore ya s que tengo que mecerlo). A su vez, para el nio, su conducta de llanto por estimulacin aversiva i nterna cesa cuando otros le solucionan el problema, con lo cual se refuerza el llanto como futura conducta de evitacin ante esa molestia. Ms ejemplos se pueden encontrar en Steiner (1988).
263
Tudela (1981), coincidiendo en cierto modo con Tarpy (1975) y a Tarpy y Mayer (1978), agrupa estas teoras en dos tendencias: - la de los tericos del reforzamiento (que acentuaron la importancia de la motivacin interna del organismo), - la de los skinnerianos (que se fijaron ms en el papel de la estimulacin externa). La primera se referir a la teora bifactorial clsica de Mowrer, reformulada despus por Miller, Kamin, Solomon, Wynne, etc. La segunda se centra en la revisin de Schoenfeld, con su modelo de refuerzo sin motivacin. La misma teora bifactorial ha experimentado reformulaciones recientes de tipo cognitivo. Veamos pues, estos dos tipos de teoras en tres apartados: la teora bifactorial en su formulacin clsica, la teora del refuerzo sin motivacin y la actual reformulacin cognitiva de la teora bifactorial. a) Teora bifactorial de Mowrer Segn Mowrer (1947) -con reelaboraciones posteriores de Miller (1951, 1959) y del propio Mowrer (1960)- el hecho cuya ocurrencia activa la respuesta de evitacin es el miedo, el cual acta como un impulso (drive) que proporciona energa a la respuesta de evitacin y refuerzo negativo al cesar con ella mediante su reduccin. Pero el miedo al ED en este caso no es un impulso primario sino adquirido por condicionamiento clsico. El miedo es por tanto una RC al ED (que acta como EC) que se adquiere por el apareamiento previo de ED con el EI aversivo. Hay pues dos fases:
I) II) ED (= EC) ED
Eav (=EI)
RC (miedo)
Durante los primeros ensayos en que la respuesta de evitacin todava no ha sido aprendida, el apareamiento ED-Eav produce el condicionamiento de miedo al ED. De este modo el condicionamiento clsico del ED proporciona un significado de motivacin y emotividad aversiva a estmulos inicialmente neutros (Gray, 1988; trad. cast. 1993, p. 196). Despus, en la segunda fase, la sola presencia del ED provoca el miedo, lo cual activa la respuesta instrumental. La ejecucin de la respuesta hace cesar el ED (ste cese contingente sera un factor crtico), con lo cual desaparece o disminuye el miedo y se refuerza la respuesta. La respuesta instrumental se aprende no por evitar la estimulacin aversiva sino por escapar al miedo al cesar el ED con dicha respuesta Ha sido una teora muy estudiada y con gran soporte y evidencia experimental. Incluso ha sido mejorada con los aos. Por ejemplo, hoy da se considera (Gray, 1988; trad. cast. 1993, p. 208) que el comportamiento de evitacin es reforzado no slo por la reduccin del miedo al cesar E D, sino tambin por la aparicin, tras la respuesta, de seales de seguridad, que son estmulos presentes tras la respuesta de evitacin, por ejemplo en animales en la caja de saltos, el feedback cinestsico o propioceptivo tras el salto, la llegada al otro lado, etc. Son reforzadores secundarios pues aparecen siempre conjuntamente con el refuerzo negativo (cese de la seal condicionada aversiva). Esta teora ha sido aplicada en el contexto clnico a la explicacin de ciertas neurosis, particularmente fobias. As, no hay ms que entender la respuesta instrumental de evitacin como la conducta neurtica, la cual es mantenida porque con ella cesa el miedo o la ansiedad que se ha condicionado fuertemente al ED. b) Teora de refuerzo sin motivacin de Schoenfeld
264
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
Segn Schoenfeld (1950), el miedo es un proceso mediacional inobservable (y por tanto inestudiable desde una ptica conductista). El cese del estmulo aversivo con la respuesta acta como refuerzo negativo aumentando la probabilidad de la respuesta que lo suprime. En virtud de su frecuente asociacin con el estmulo aversivo, el ED se convierte en estmulo aversivo condicionado, adquiriendo as las caractersticas aversivas del shock. El sujeto escapa del ED (sin embargo, en la teora de Mowrer el sujeto escapa del miedo suscitado por el ED). Tambin se trata de una teora bifactorial pues el ED es refuerzo condicionado por condicionamiento clsico y la respuesta de evitacin es instrumentalmente reforzada por la terminacin del ED. En realidad, ambas teoras reducen la situacin de evitacin a un problema de escape. Segn Mowrer, el sujeto escapa del miedo, o del ED segn Schoenfeld. En ambos casos, el acontecimiento reforzador observable es el cese del ED. c) Reformulacin cognitivo-social de la teora bifactorial Desde la teora de las expectativas de auto-eficacia de Bandura (1977, 1986), se ha replanteado recientemente la teora bifactorial, al menos en su aplicacin a humanos (Villamarn, 1990). Segn esta teora, tanto la activacin de RC autonmica de miedo como la emisin de respuestas de evitacin dependen no slo de la activacin de expectativas adversas (el EC seala un prximo acontecimiento aversivo) sino sobre todo de la "competencia percibida" de tener capacidad para hacer frente a esa posible adversidad. Si el individuo percibe que dispone de conductas de afrontamiento y genera as expectativas de auto-eficacia, entonces habr menor miedo o ansiedad. Por tanto, lo que produce el miedo y la ansiedad no es el proceso de condicionamiento clsico previo sino las cogniciones o expectativas de resultados y las expectativas acerca de la propia eficacia para afrontarlos.
265
10 segundos en cada ensayo) no se produjo extincin durante 20 das a razn de 200 ensayos de extincin diarios. La extincin de la conducta de evitacin es pues sumamente difcil y si pensamos en las fobias como conductas de este tipo ante ECs anormalmente aversivos y la dificultad para eliminarlas, podremos comprender la importancia de este tema. Hay ms ejemplos cotidianos que tendran su explicacin dentro de estas cuestiones de la conducta de evitacin. As, Gray (1988; trad. cast. 1993, p. 211) sostiene que el aprendizaje de evitacin est implicado en el establecimiento de formas de comportamiento (tanto grupales como individuales) muy persistentes en el hombre. Ejemplos sociales o grupales tenemos: la disciplina militar, formas de comportamiento ritual propias de algunas religiones o sectas; un ejemplo de comportamiento ritual individual es el comportamiento obsesivo-compulsivo. En estos casos tenemos dos elementos: - Una serie de acciones o conductas que deben realizarse (sean razonables o absurdas, necesarias o intiles, sencillas o dificilsimas). - La omisin de estas conductas se castiga desde el primer momento (desde la infancia en el caso del obsesivo-compulsivo), conduciendo a una gran ansiedad posterior, de modo que aunque ya sea improbable el castigo (el grupo opresor, la institucin en la que se aplicaba el castigo, etc.), cualquier seal del entorno condicionada a ello seguir activando al menos el miedo o la ansiedad, y con ello la necesidad de llevar a cabo las conductas de evitacin correspondientes (rituales, etc.). La evitacin incluye pues otros componentes mediacionales decisivos para explicar su anormal persistencia o resistencia a la extincin, entre ellos la aparicin en su formacin de un estado emocional de temor, miedo y ansiedad que desde la teora bifactorial de Mowrer se sabe que surge como RC interna al EC aversivo y de manifestacin previa a la respuesta de evitacin. Para explicar esta resistencia a la extincin de la respuesta de evitacin, Solomon y Wynne (1954), en consonancia con la teora bifactorial de Mowrer, formularon el Principio de conservacin de la ansiedad. Este principio nos dice que el EC aversivo suele durar muy poco por la rpida aparicin de la respuesta de evitacin, con lo cual casi nunca se emite plenamente la RC de temor o ansiedad, y as es como sta se preserva y no se logra extinguir; parece pues que si se lograse extinguir la RC de miedo o ansiedad, tambin se extinguira la respuesta de evitacin. b) Procedimientos para acelerar la extincin de la conducta de evitacin Se han ensayado experimentalmente diversos procedimientos, algunos de los cuales pasaron a la aplicacin clnica. Describiremos aqu los ms importantes. SATURACIN DE EC Y BLOQUEO DE RESPUESTA: LA TCNICA DE INUNDACIN Esta tcnica, ya empleada por Solomon et al. (1953), es denominada tambin "exposicin forzada mediante prevencin de respuesta" segn Bandura (1969), y su derivacin clnica se conoce con el nombre de inundacin (flooding). Consiste en impedir la respuesta de evitacin al presentar repetidas veces el EC temido en ausencia del EI. De esta forma, la RC de temor se emite varias veces con toda su fuerza y se extingue. Segn Shipley (1974), lo importante es el tiempo total de exposicin al EC y tambin el aprendizaje de una nueva respuesta (la de inmovilidad) que interfiere con la respuesta de evitacin. Aunque ninguna de estas teoras ha sido del todo convincente, lo cierto es que este procedimiento produce una rpida extincin, aunque no est exento de efectos secundarios (alteraciones somticas por la intensidad de la emocin vivida, etc.). Se han investigado las distintas condiciones que afectan a la extincin mediante inundacin, y segn Tarpy (1981; trad. 1986, p. 363) seran las siguientes:
266
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
- Grado de control ejercido por el sujeto durante la inundacin: Si el sujeto puede controlar la terminacin del EC mediante la respuesta de evitacin, la extincin ser ms lenta que si no existe tal control (Katzev y Berman, 1974). - Tiempo de exposicin al EC: Cuanto mayor sea la duracin total de exposicin al EC o el nmero de ensayos de EC, mejor ser la extincin (Shipley, 1974; Bersh y Keltz, 1971). - Intensidad del EI: Cuanto mayor sea la intensidad peor extincin (Baum, 1969). TERMINACIN DEL EC DESPUS DE LA RESPUESTA DE EVITACIN Segn Adams (1980; trad. 1983, p. 120), si el EC durante la fase de extincin se retrasa ms all de la terminacin de la respuesta de evitacin, entonces el sujeto podr distinguir (discriminar) esta fase de la de adquisicin (en que el EC terminaba al comenzar la respuesta de evitacin). Katzev (1967) realiz un experimento para comprobar la eficacia de este mtodo utilizando ratas en una caja de saltos (donde EC = zumbador + luz, y EI = descarga elctrica). En los 200 ensayos de adquisicin los animales evitaban la descarga saltando (respuesta de evitacin) en los 5 segundos iniciales del EC (tras el salto cesaba el EC). Durante la fase de extincin hizo dos grupos: en el grupo I el EC terminaba con el inicio de respuesta de evitacin o a los 5 segundos si no ocurra la respuesta de evitacin. En el grupo II el EC continuaba 20 segundos despus de la respuesta de evitacin. Los resultados mostraron una menor resistencia a la extincin en el grupo II. De todas formas el experimento no est exento de crticas pues el grupo II tuvo una mayor exposicin al EC y, como vimos en la tcnica de inundacin, eso es un factor decisivo. CASTIGO DE LA RESPUESTA DE EVITACIN: CONDUCTA AUTOPUNITIVA Tambin Solomon et al. (1953) aplicaron este mtodo consistente en aplicar estimulacin aversiva al emitir la respuesta de evitacin durante la extincin. Pero paradjicamente el efecto de esta tcnica fue justo el contrario: aumenta la emisin de respuesta de evitacin, a pesar de que cuanto ms responda el sujeto ms castigo recibir. Este fenmeno se ha denominado conducta de "crculo vicioso", "autopunitiva" o "masoquista", y se ha estudiado ampliamente en aprendizaje animal. Varias teoras han intentado explicar este fenmeno: - La explicacin basada en la teora bifactorial dice que el castigo durante la extincin mantiene y aumenta el nivel de temor o miedo, lo cual hace que persista la conducta de evitacin y al castigar sta aumenta el miedo y la conducta de evitacin, y as sucesivamente. - Otra explicacin, llamada "teora de la confusin", segn Tarpy (1981; trad. 1986, p. 371), se basa en una falta de discriminacin entre adquisicin y extincin. Normalmente durante la extincin no debe aparecer el EI -como ocurra durante la adquisicin-, pero al hacerlo se confunde esta fase con la de adquisicin y por tanto no se puede discriminar ambas fases. Ambas hiptesis son compatibles, segn Dreyer y Renner (1971) y desde luego permiten concluir que no estamos ante un buen mtodo de extincin de la respuesta de evitacin. EXPOSICIN GRADUADA AL EC Se trata de introducir el EC progresivamente (en presentaciones de menor a mayor aversividad) de forma que no provoquen respuesta de evitacin. Es un procedimiento citado por Bandura (1969) y que combinado con procedimientos de contracondicionamiento es la base de tcnicas tales como la desensibilizacin sistemtica.
267
Conviene, sin embargo, distinguir la definicin tcnica del castigo de su uso cotidiano. En el primer caso, se incluyen las condiciones adecuadas para el resultado de disminucin o supresin de la tasa de respuesta. En el segundo caso, a veces se dan las condiciones necesarias de efectividad y otras veces no e incluso de efectividad pero cuya aplicabilidad es tica y jurdicamente inviable (maltrato fsico, etc.). As, debe puntualizarse que el castigo no implica necesariamente dolor o coaccin fsicos, no es slo una pena impuesta por la ejecucin de un acto determinado. Por otra parte, muchas veces se aplica el castigo sin una relacin contingente con la respuesta; sirvan como ilustracin los siguientes ejemplo: - A los nios a veces se les "da una leccin" por su mala conducta sometindoles a algn sacrificio o escarmiento, aunque sea bastante despus de realizada; - los criminales reciben penas que no necesariamente disminuyen la frecuencia de sus actos criminales; - muchas veces el castigo fsico que un padre inflige a su hijo no es porque el nio haya hecho nada especialmente malo, sino por disgustos personales o matrimoniales que encuentran su desahogo en la violencia ejercida sobre el ms dbil (vase sobre este asunto el magnfico monogrfico que sobre maltrato infantil ha publicado la revista Infancia y Aprendizaje, 1995, n 71). En estos ejemplos, usualmente denominados de "castigo", efectivamente lo son pues hay estimulacin punitiva ulterior a la conducta, pero puede faltar lo decisivo en una definicin tcnica de castigo que es su efecto sobre la conducta (reduciendo su frecuencia o suprimindola) y una contingencia respuesta - castigo. b) Lneas de investigacin Respecto a las lneas de investigacin que se han seguido sobre el castigo, Pelechano (1980, p. 232) seala dos fundamentales: la que proviene del conductismo y el aprendizaje animal y la llevada a cabo en psicologa evolutiva: APRENDIZAJE ANIMAL La historia habra que iniciarla en Thorndike, quien en 1911 formul la ley del Efecto no slo en su aspecto positivo sino tambin negativo (la estimulacin aversiva debilita o elimina las asociaciones E-R establecidas), aunque en reformulaciones posteriores renunci a este principio pues obtuvo evidencia en humanos de que el castigo sobre respuestas errneas no mejoraba el rendimiento en las respuestas alternativas.
268
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
Posteriormente, Skinner (1938) y Estes (1944) comprobaron que el castigo no debilita la relacin entre estmulo y respuesta ni elimina la conducta sino que slo la suprime temporalmente. Estos resultados llevaron a la conclusin prctica de procurar la no utilizacin del castigo como medida disciplinaria y al abandono de la investigacin sobre este campo, hasta su relanzamiento en la dcada de los 60 con autores tales como Mowrer, Azrin, Church, Solomon, etc. PSICOLOGA EVOLUTIVA Nos referimos en este apartado a teoras influyentes sobre el desarrollo infantil, en las cuales se introducen explicaciones sobre el castigo. Inicialmente habra que citar las teoras de Freud y Watson. Freud, al hablar del proceso de "internalizacin" (por el cual el nio incorpora o asimila fundamentalmente las normas sociales) indica que se trata de pasar de un sistema de castigos y premios externos a otro interno (mediante sentimientos de culpa y/o ansiedad). El castigo aparecera pues como un procedimiento con efectos altamente desagradables y muy peligroso en los nios. Watson, por otra parte defendi en un principio, al menos tcitamente, sistemas de castigo para la crianza de los nios, aunque ms tarde corrigi dicha postura. Estas teoras llevaron a que de algn modo se paralizase la investigacin sobre el tema hasta recientemente en que ms bien (y puesto que en trminos sociales es un fenmeno y una prctica que no disminuye) se trata de analizar los aspectos positivos que pueda tener la aplicacin del castigo (efectividad y control de efectos nocivos secundarios).
269
CASTIGO POR SUPRESIN El castigo por supresin (de reforzadores), tambin llamado "castigo negativo" consiste en suprimir un reforzador positivo despus de una respuesta, por tanto no se aplica estimulacin punitiva directa. Su esquema es R - No Eref. Por ejemplo: - Perder privilegios por volver tarde a casa, - perder dinero por mal comportamiento, - retirada del carnet de conducir tras cometer una infraccin grave, etc. CRTICAS A ESTA CLASIFICACIN En realidad, es una clasificacin criticable desde un punto de vista tcnico de definicin del castigo. En particular, el castigo por supresin es perfectamente equiparable a la extincin del condicionamiento de recompensa. En aquel momento (vase Captulo 6), se insista en el aspecto operante de disminucin de tasa de respuesta, pero no se mencionaba el factor emocional de dolor o frustracin por la prdida del refuerzo. Esta confusin conceptual ha llevado a una divisin de opiniones entre los autores: los mismos procedimientos prcticos de reduccin o eliminacin de conductas se incluyen dentro de temas o captulos de castigo (por ejemplo, Drabman, 1977) o de tcnicas de extincin de condicionamiento de recompensa (por ejemplo, Milby, 1982). En cualquier caso, una descripcin de estos procedimientos se puede encontrar en el apartado 4.1.1. del Tema 4.
270
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
3) Duracin del estmulo punitivo: A mayor duracin mejor es la supresin de la conducta, aunque es muy probable que con una perturbacin emocional mucho mayor. 4) Presentacin repentina o gradual: El estmulo punitivo es ms eficaz si se presenta de modo repentino que si se hace de forma gradual, dado que en este ltimo caso se va produciendo una habituacin al estmulo aversivo. 5) Programas de castigo: Se trata de aplicar los mismos programas que se utilizaron con el refuerzo (vase Tema 4). El programa de castigo ms eficaz es el continuo (respuesta-castigo) tanto en animales como en humanos. En los de razn fija la eficacia es mayor cuanto mayor sea el volumen de estimulacin punitiva, y al aplicarlo se observa una disminucin progresiva de la tasa de respuesta. Con programas de intervalo se desarrolla una supresin anticipatoria, sobre todo con intervalos fijos (disminuye la frecuencia de respuesta antes de que se emita estimulacin punitiva). 6) Demora del castigo: Normalmente a menor contigidad espacio-temporal entre castigo y conducta menor eficacia del mismo. Sin embargo, en sujetos humanos este factor es menos importante. 7) Orden temporal en las secuencias premio - castigo: En una secuencia R instrumental - E reforzante - R consumatoria, segn el momento en que se aplique castigo (estimulacin aversiva), el resultado conductual ser diferente. Citemos dos posibilidades: - Secuencia castigo - premio: Con la secuencia R instr. - E av. - E ref., es decir, castigando la respuesta instrumental pero permitiendo la aparicin posterior del premio, paradjicamente, no se suprime la respuesta instrumental y adems la estimulacin aversiva hace de EC o seal de un estmulo reforzante posterior. Con todo ello se logra, mediante este contracondicionamiento (1 castigo, 2 recompensa), una mayor resistencia al castigo, es decir, una mayor resistencia a la extincin de la respuesta castigada. Es otra manifestacin de la conducta masoquista antes mencionada -recurdese que se produca conducta masoquista al castigar la respuesta de evitacin, con lo cual, tenamos una secuencia R instr. - E ref negativo (cese de EC) - E av.-. En humanos, esta bsqueda de estmulos dolorosos, tan extraa en la mayor parte de congneres, tendra explicacin en funcin de esta secuencia premio - castigo, tal y como comenta Gray (1988; trad cast. 1993, p. 148): supuestos una serie de experiencias condicionantes en la infancia en las que el dolor se ha seguido de una buena recompensa (y es fcil de imaginar que esto sucede normalmente). - Secuencia premio - castigo: Se trata de la secuencia R instr. E ref. R consumatoria E aversivo
En una secuencia como la del experimento de los cachorros de Solomon antes mencionado, produce el efecto contrario: una rpida extincin de la R instrumental y de la R consumatoria, pero tambin la aparicin de una intensa RC de miedo. En trminos coloquiales, algunos autores (por ejemplo Eysenck) sugieren que estos fenmenos estn involucrados de algn modo con el desarrollo de la conciencia moral. En efecto, al no emitir la respuesta, se produce una resistencia anticipada a la tentacin. Pero si alguna vez comete la respuesta prohibida, entonces el sujeto experimentar sentimientos de culpa. b) Condiciones ptimas de efectividad del castigo en contexto aplicados Craighead et al. (1976) sealan las siguientes:
271
1) Aplicacin inmediata del estmulo aversivo punitivo o supresin del refuerzo despus de la respuesta no deseada. De la misma forma que en el entrenamiento de recompensa, tambin en el caso del castigo interesa que haya la menor demora posible entre la conducta y su consecuencia. 2) Castigo de todas y cada una de las incidencias de la respuesta, es decir, para que el castigo sea eficaz debe aplicarse segn un programa continuo. Hay que notar que en caso de que el castigo no se produzca segn un programa continuo, ello implicar que todas las conductas no castigadas se estn dando porque tienen algn tipo de reforzamiento; por consiguiente, y de acuerdo con el efecto del refuerzo parcial ya estudiado, la conducta tender a mantenerse resistente a la extincin. En el caso del castigo suele ser an ms importante que en el caso de la recompensa una aplicacin consistente desde el principio del entrenamiento para optimizar su efecto. 3) Introduccin del estmulo contingente de castigo en su mxima intensidad (ms que con aumento gradual de severidad) pero, en el caso de humanos, con proporcionalidad entre la intensidad del estmulo punitivo y la fuerza de la conducta que se quiere extinguir (Marcos, 1994b, p. 86). Si la intensidad del castigo es desproporcionadamente elevada, se facilitar la induccin de efectos secundarios perjudiciales, segn ser comentado a continuacin; por el contrario, si el castigo es demasiado leve y las consecuencias extrnseca o intrnsecamente reforzantes de la conducta son ms importantes para el sujeto, lgicamente tal conducta tender a persistir. 4) Supresin de la motivacin para la respuesta no deseada. 5) Preparacin de una respuesta alternativa aceptable (en especial cuando no puede eliminarse la motivacin para la respuesta no deseada). Resulta crucial este factor de refuerzo de conductas alternativas, como una manera de reencauzar las motivaciones del sujeto en direcciones de respuesta diferentes. Si bien el castigo tiende a "dejar sin salida" las motivaciones de la persona, no tendr porqu haber demasiada persistencia en la conducta problemtica cuando el individuo encuentra fcilmente conductas diferentes y asequibles a sus capacidades que empiezan a resultar instrumentales para la satisfaccin de sus necesidades. 6) Refuerzo de las respuestas incompatibles con la respuesta castigada. En algunos casos particulares, la respuesta alternativa reforzada puede ser de hecho incompatible e incluso opuesta a la conducta que se desea extinguir. As, por ejemplo, un chico que tiene el hbito de morderse las uas, puede ser reforzado (mediante alabanzas o refuerzos intercambiables, por ejemplo) cada vez que, al percatarse de que va a iniciar el mordisqueo, cierra el puo o mete durante un minuto su mano en el bolsillo. 7) En seres humanos, una descripcin de la contingencia del castigo que permita que el sujeto sea consciente de por qu se le castiga. La aplicacin consistente del castigo sin explicaciones, tal como obviamente se hace con los animales en el laboratorio, da lugar a asociaciones representacionales sobre la contingencia del castigo, pero tales representaciones se ven facilitadas si la experiencia directa de castigo va acompaada por una explicacin verbal congruente. 8) An sealizaramos nosotros un ltimo factor o condicin para la ptima efectividad del castigo en humanos, y se refiere a que tal castigo est lo ms directamente posible relacionado con la conducta problema y sus consecuencias naturales. Un buen ejemplo de ello es la restitucin del dao que comentamos en un apartado anterior. Como vemos, se trata de un resumen o enumeracin con fines evidentemente prcticos de algunos de los factores sealados en el apartado anterior.
272
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
c) Efectos secundarios (perjudiciales) del castigo Aunque parece que siguiendo las normas antes citadas se podran obtener resultados positivos con el castigo, sin embargo no dejan de aparecer efectos perjudiciales, tanto por no lograr la supresin de la conducta castigada, como por la aparicin de efectos secundarios perjudiciales. Dichos efectos se pueden concentrar en cinco apartados: - Aparicin de respuestas emocionales negativas y/o problemticas.- La aplicacin de tcnicas de castigo sin alternativa de respuesta segn Walter y Grusec (1977) y con estimulacin punitiva intensa provoca ciertas alteraciones comportamentales y un incremento de la ansiedad y de la inhibicin comportamental. - Aparicin de conductas de evitacin del agente punitivo y del contexto de la situacin de castigo.Se llega a una evitacin del agente punitivo y del contexto ambiental o estimular con l asociado. Los efectos son fciles de imaginar en caso de aplicacin del castigo en nio, por ejemplo, en el mbito familiar (falta de comunicacin padres-hijos, etc.); o en el escolar (aversin al profesor, al colegio, al estudio, etc.). - Efecto rebote o incremento de la respuesta castigada en ausencia de la situacin (agente punitivo y contexto) de castigo.- Si se castiga una conducta problemtica que vena mantenindose previamente por condicionamiento de recompensa, se reducir dicha conducta, pero cuando deje de aplicarse el castigo no slo no se reducir la tasa de respuesta sino que se incrementar por encima del nivel que tena cuando sta era reforzada antes del castigo. Marcos (1994b, p. 87) pone un ejemplo muy ilustrativo:
Imaginemos que un nio comienza a fumar porque as obtiene cierto refuerzo social; sus padres le castigan cuando le ven fumando. Cuando el muchacho sea mayor y sus padres no puedan castigarle, entonces fumar ms que si no le hubieran castigado nunca.
Adems, al administrar repetidamente el castigo, los estmulos asociados al agente o situacin punitiva se condicionan, con lo cual, en ausencia de ese contexto la respuesta castigada se recupera con facilidad. Todo ello surge, evidentemente, al no conseguirse una verdadera supresin de la motivacin para la conducta. - Imitacin futura de la conducta castigadora.- El agente punitivo segn Pelechano (1980, p. 351) "se convierte en un modelo poderoso que castiga y promueve, en nios y adultos, conductas de castigo por modelado comportamental" (aprendizaje observacional). El sujeto castigado tiende a aprender que ese es el patrn de conducta pertinente para dirigir el comportamiento de los dems. - Persistencia de la motivacin para realizar la conducta problema.- Si no se proporcionan conductas alternativas a la castigada, el sujeto aprende a no hacer algo, es pues un aprendizaje asociativo de carcter negativo que puede que suprima una conducta observable, pero no la motivacin para hacerla, de modo que cuando pueda (est ausente el agente punitivo, etc.) volver a hacerla; se establece, en todo caso un conflicto aproximacin - evitacin que no se resolver hasta que se ofrezca la posibilidad de obtener el mismo refuerzo pero con otras conductas socialmente ms correctas. Dicho todo esto, es obvio que el uso aplicado del castigo debera restringirse a casos puntuales, nunca el castigo fsico, y siempre que no haya ningn procedimiento alternativo y aplicndolo con arreglo a las normas antes mencionadas.
273
6.5. La prdida del control de la accin: Indefensin aprendida 6.5.1. Concepto y tcnicas experimentales
En el apartado anterior estudiamos la aplicacin de estimulacin punitiva contingente a la respuesta. Eran situaciones en las cuales el sujeto aprenda una relacin o asociacin entre su respuesta y una consecuencia negativa; en cierto modo, adquira un cierto control sobre su entorno pues aprende a no hacer algo por sus malas consecuencias o, en el caso de la evitacin, aprende a hacer algo para no sufrir malas consecuencias. En definitiva, con su conducta controla la situacin. Ahora bien, es posible que se aplique la estimulacin punitiva de forma no contingente a la respuesta. En estos casos, el sujeto con su conducta no tiene control sobre los acontecimientos y ello ser bastante negativo. De hecho, en la vida cotidiana no es algo infrecuente. Por ejemplo, en una situacin de desempleo, la persona comienza intentando diversas estrategias para conseguir un trabajo (presentarse a oposiciones, buscar enchufes, consultar bolsas de trabajo, apuntarse en una oficina de empleo, etc.); si transcurrido un tiempo no lo consigue, esa estimulacin aversiva (desempleo) persiste y no es contingente a las respuestas de evitacin (las estrategias de bsqueda antes mencionadas). Hay otras situaciones problemticas en las que hagamos lo que hagamos no las resolvemos pero su repercusin es ms o menos negativa segn su duracin, intensidad o posibilidades de escape. La investigacin experimental lleva desde 1967 estudiando sistemticamente dicho fenmeno. En esa fecha, Seligman y colaboradores (Overmier y Seligman, 1967; Seligman y Maier, 1967) expusieron a unos perros (en cajas de saltos) a una serie de shocks inescapables y despus observaron que estos animales eran incapaces de aprender una nueva conducta consistente en evitar o escapar de los shocks, esta vez s contingentes a dicha conducta. A dicho fenmeno se le llam learned helplessness, traducido por trminos diversos tales como desamparo, impotencia, desesperanza o indefensin aprendida, y cuya formulacin sera la siguiente: "Los organismos expuestos a una situacin incontrolable, con frecuencia muestran dficits posteriores en el aprendizaje de nuevas respuestas de xito" (Maier y Seligman, 1976). Experimentalmente no slo se ha demostrado en perros sino tambin en otros animales y tambin en humanos (vase Garber y Seligman, 1980, para revisin), sea con ruidos desagradables (Hiroto, 1974) o con anagramas irresolubles (Romero, Lpez y Diez, 1988). Segn Seligman (que es el principal investigador en este terreno), el concepto de indefensin describe al menos tres cosas diferentes: - Un procedimiento experimental: exposicin a consecuencias incontrolables, o sea, estimulacin aversiva que no se puede evitar, ni escapar ni es contingente a la respuesta. - Un efecto conductual: inactividad como resultado de tal operacin. - Un proceso, un fenmeno de aprendizaje consistente en la adquisicin de cogniciones especficas a tal procedimiento y responsables del efecto conductual. Las teoras elaboradas en torno a dicho fenmeno, adems de romper con las teoras tradicionales E-R al incluir variables mediacionales cognitivas (atribucin, expectativas), estn teniendo en la actualidad gran aplicacin en clnica, sobre todo en el campo de la depresin. Las tcnicas o procedimientos experimentales por los cuales se ha evidenciado la indefensin aprendida se describen en el Cuadro 3.
274
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
El paradigma experimental clsico de indefensin aprendida, tal y como se llev a cabo en los primeros experimentos de Seligman, se denomina diseo tridico. Aunque ha experimentado numerosas variaciones y crticas, lo cierto es que ha sido la tcnica ms utilizada. Supone dos fases: una de pre-tratamiento o de induccin y otra de prueba. - En la fase de pre-tratamiento se hacen tres grupos de sujetos: 1) Grupo escapable, que se somete a descargas escapables mediante procedimiento de escape o evitacin: Eav - R No Eav (Ref. neg.) 2) Grupo inescapable, idntico en todo al anterior ("acoplado al anterior") excepto en que la respuesta no impide ni afecta a la estimulacin aversiva previa: Eav - R Eav 3) Grupo control o inexperto pues no tiene experiencia de estimulacin aversiva. - En la fase de prueba todos los grupos son sometidos a un condicionamiento de escape o evitacin de modo que se mide y se compara la rapidez de adquisicin. Los grupos 1 y 3 suelen mostrar una mayor rapidez en la adquisicin que el grupo 2 que es ms lento por la interferencia de la fase aversiva inescapable no contingente. As pues, todos los procedimientos experimentales, tanto en humanos como en animales tienen el objetivo de conseguir que el sujeto perciba el no control sobre las consecuencias o sobre los acontecimientos. Con este mismo diseo tridico se han empleado diversos procedimientos en ambas fases (Ferrndiz, 1989): - En la fase de pre-tratamiento, en animales sobre todo se han utilizado descargas elctricas (por ejemplo, 60 descargas inescapables de 6 mA (miliamperios) y 5 segs. de duracin espaciados durante 3 horas). Con humanos hay ms variedad: . estimulacin aversiva o ruidos intensos molestos, . feedback negativo o positivo incontrolable, . fracaso inducido por el experimentador, . problemas discriminativos irresolubles, . puzzles irresolubles, . anagramas irresolubles, etc. - En la fase de prueba, con animales se emplea condicionamiento de escape y evitacin o laberintos. Con humanos: . resolucin de anagramas, . terminacin de ruidos intensos y . tareas de decisin lxica. Las medidas ms utilizadas han sido: - para aspectos motivacionales: latencia de respuesta, - para aspectos emocionales: cuestionarios y observacin conductual, y - para aspectos cognitivos: autoinformes, numero de ensayos para resolver problemas, nmero de errores, etc.
275
b) Generalizacin o transferencia Una vez inducida indefensin, se podr transferir a otras situaciones incluso dndose las siguientes caractersticas (Ferrndiz, 1989): - Siempre que en la fase de transferencia se empleen tambin estmulos punitivos. - Puede haber transferencia de una situacin traumtica (descarga elctrica) a otra no traumtica (prueba de laberintos). - Puede darse de tareas instrumentales (ruido inescapable) a tareas cognitivas (prueba irresoluble de anagramas).
276
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
El mismo autor sugiere que el endurecimiento es una posible explicacin a la tolerancia al estrs.
277
2, percepcin de no contingencia presente y pasada (el sujeto podra pensar: hasta ahora todo lo que hago no me sirve para resolver el problema) 3, atribucin de no contingencia pasada y futura (mis acciones no resuelven ni resolvern el problema) 4, expectativa de no contingencia futura (haga lo que haga no resolver el problema) 5, sntomas de indefensin. En este nuevo esquema, el mecanismo por el cual se establece la expectativa de no contingencia (consistente en el convencimiento de sujeto de que en el futuro la respuesta no causar el cese de la estimulacin aversiva por tanto no se responde) es la atribucin de no causalidad entre la respuesta y la estimulacin nociva (la respuesta no causa el cese de la estimulacin aversiva). El nuevo modelo no puede explicar la indefensin en especies infrahumanas pero s es til y aplicable a la indefensin en humanos, en donde las teoras anteriores no podan explicar dos fenmenos especficos como son: - la generalidad y la cronicidad de los dficits y - la prdida de autoestima. Esta prdida de autoestima resulta en principio algo paradjico pues si el sujeto perciba que ninguna respuesta era eficaz no tena por qu sentirse daado. Pero, como apuntan Vzquez y Polaino (1982), es posible que el individuo indefenso piense no ya que toda respuesta posible tenga consecuencia alguna en el medio, "sino que puede que crea que slo l mismo carece de ella" (p. 74) por falta de inteligencia, capacidad, etc. Habran pues dos tipos de atribuciones: - Atribuciones de no causalidad respuesta - consecuencia (la respuesta no produce consecuencias favorables de cese del problema o estimulacin aversiva). - Atribuciones de carencia de respuesta apropiada (no dispongo de respuestas para resolver el problema. Segn esto, la atribucin de no causalidad sera ms probable en individuos con locus de control externo (atribuyen la causa del problema a algo externo a ellos) mientras que la atribucin de carencia de respuesta apropiada sera ms propio de sujetos con predominio de locus de control interno. La reformulacin de Seligman no slo admite el papel de la atribucin causal sino la existencia de estilos atributivos en cada sujeto. Hay estilos atribucionales que infligen al sujeto una mayor vulnerabilidad a la indefensin que otros. Ya vimos en el Captulo 2 la propuesta de Seligman y colaboradores relativa a las tres dimensiones del estilo atribucional: - Interna / externa - Estable / inestable - Global / especfica Tal y como se explicaba en aquel captulo, un perfil atribucional interno - estable - global ser el de peor pronstico para inducir una actitud de indefensin o incluso estados depresivos. El perfil externo- inestable - especfico ser el ms favorable tras una situacin de incontrolabilidad o de fracaso -vase el Captulo 11 de Steiner (1988; trad. cast. de 1990) o Klein (1991; trad. cast. de 1994, pp. 322-331) para una ilustracin con ejemplos al respecto y en el apartado 7.2.2.a, en el Anexo 2 del Captulo 1-. Hay otros matices observados en cada estilo atribucional. As: - Si la atribucin es estable los dficits sern ms crnicos que si es inestable. - Los externos no tienen prdida de autoestima (no son los responsables de sus fracasos) y s los internos.
278
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
DEPRESION
INDEFENSION APRENDIDA
1. Pasividad ................................................................. 1. Pasividad 2. Conjunto de pensamientos negativos ..................... 2. Dficits cognitivos (dificultades en (pesimismo) aprendizajes de respuestas de xito) 3. Curso de tiempo ...................................................... 3. Curso de tiempo 4. Hostilidad introyectada ............................................ 4. Prdida de agresin 5. Prdida de peso, apetito, dficits ............................ 5. Prdida de peso, apetito, dficits sociales y sexuales sociales y sexuales 6. Decremento de norepinefrina .................................. 6. Decremento de norepinefrina
279
280
Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
Anotaciones y observaciones