Está en la página 1de 46

Tema 5

Condicionamiento instrumental: Control de estmulos y condicionamiento con estimulacin aversiva

Bloque 2: Aprendizaje asociativo mediante condicionamiento


Tema 3: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO CLSICO Tema 4: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO INSTRUMENTAL DE RECOMPENSA Tema 5: CONDICIONAMIENTO INSTRUMENTAL: CONTROL DE ESTMULO Y CONDICIONAMIENTO CON ESTIMULACIN AVERSIVA

Indice del Captulo 1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE CLAVES CONTEXTUALES ANTECEDENTES237 1.1. Introduccin ...................................................................................................................................................................... 237 1.1.1. El aprendizaje de seal en el condicionamiento instrumental .................................................................................. 237 1.1.2. El aprendizaje de seal como control de estmulos .................................................................................................. 238 1.1.3. Variaciones en las condiciones antecedentes y resultados de generalizacin y discriminacin .............................. 238 1.1.4. Implicaciones prcticas del aprendizaje instrumental sealizado............................................................................. 238 1.2. Tcnicas experimentales .................................................................................................................................................. 240 1.2.1. Tcnicas simples: el refuerzo diferencial .................................................................................................................. 240 1.2.2. El gradiente de generalizacin / discriminacin ........................................................................................................ 240 2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS GENERALIZADOS ................................................ 241 2.1. Procedimientos de estudio de la generalizacin .............................................................................................................. 241 2.2. Tipos de generalizacin .................................................................................................................................................... 242 2.2.1. Generalizacin de estmulo....................................................................................................................................... 242 2.2.2. Generalizacin de respuesta: Moldeamiento o aproximaciones sucesivas .............................................................. 242 2.3. Por qu la generalizacin (teoras explicativas) ............................................................................................................... 243 3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS .................................................................. 244 3.1. Tcnicas simples: Refuerzo diferencial discriminativo ..................................................................................................... 244 3.2. Tcnicas complejas de adquisicin de discriminacin ..................................................................................................... 245 3.2.1. Atenuacin o desvanecimiento del estmulo ............................................................................................................. 245 3.2.2. Comparacin con la muestra .................................................................................................................................... 246 3.2.3. Combinacin de ED y refuerzo secundario: el encadenamiento .............................................................................. 246 3.3. Por qu ocurre la discriminacin (teoras explicativas) .................................................................................................... 247 4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS ....................................................................... 248 4.1. Condiciones durante la adquisicin .................................................................................................................................. 248 4.2. Condiciones de entrenamiento previo en discriminacin ................................................................................................. 249 5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO .................................. 251 5.1. Aplicacin de instigadores y desvanecimiento ................................................................................................................. 251 5.1.1. Dificultades con el refuerzo diferencial ..................................................................................................................... 251 5.1.2. Los instigadores como facilitadores de la discriminacin ......................................................................................... 252 5.1.3. Desvanecimiento de los instigadores ....................................................................................................................... 253 5.1.4. Mtodos aplicados a la reeducacin de las dificultades de aprendizaje .................................................................. 253 5.2. Cambio de un control de estmulo por otro: El cambio fsico de ambiente ...................................................................... 254 6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO ........................................................................................................... 254 6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin aversiva ........................................................... 254 6.1.1. Tipos de aversividad ................................................................................................................................................. 254 6.1.2. Tipos de condicionamiento con estimulacin aversiva ............................................................................................. 255 6.2. Condicionamiento de escape ........................................................................................................................................... 256 6.2.1. Definicin .................................................................................................................................................................. 256 6.2.2. Condiciones o factores en la adquisicin de la conducta de escape ........................................................................ 257 6.3. Aprendizaje de evitacin................................................................................................................................................... 258 6.3.1. Definicin, fases en la adquisicin, tipos y procedimientos ...................................................................................... 258 6.3.2. Condiciones para la adquisicin de la respuesta de evitacin ................................................................................. 261 6.3.3. Por qu ocurre la evitacin (teoras explicativas) ..................................................................................................... 262 6.3.4. Extincin de la respuesta de evitacin ...................................................................................................................... 264 6.4. Castigo ............................................................................................................................................................................. 267 6.4.1. Definicin, caractersticas y lneas de investigacin ................................................................................................. 267 6.4.2. Tipos de castigo: Castigo por aplicacin y por supresin ......................................................................................... 268 6.4.3. Condiciones para la efectividad del castigo .............................................................................................................. 269 6.5. La prdida del control de la accin: Indefensin aprendida ............................................................................................. 273 6.5.1. Concepto y tcnicas experimentales ........................................................................................................................ 273 6.5.2. Efectos o resultados de la indefensin aprendida .................................................................................................... 274 6.5.3. Condiciones para la adquisicin de la indefensin aprendida .................................................................................. 275

- 235 Asignatura: Aprendizaje (6 crditos). Obl. de 2 curso Grado Psicologa, Curso 2010/2011 Profesores: Dr. Agustn Romero Medina (agustinr@um.es) y Ldo. Pedro Jara Vera (pjara@um.es). Dept Ps. Bsica y Metodologa. Univ. de Murcia. Fac. Psicologa; En Aula Virtual Fac. Psicologa en http://avpsi.inf.um.es/moodle/ (usuario: dni sin letra; contrasea: dni sin letra); y en SUMA campus virtual

236

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

6.5.4. Por qu ocurre la indefensin aprendida (teoras explicativas) ................................................................................ 276 6.5.5. Repercusiones aplicadas de la indefensin aprendida ............................................................................................ 278 7. PRCTICAS DE AUTOEVALUACIN DEL TEMA 5 ............................................................................................................. 279

Resumen del tema En cuanto al control de estmulo en el condicionamiento instrumental, en mayor o menor medida, hay variedades de aprendizaje mediante condicionamiento que combinan aspectos del condicionamiento clsico y del instrumental. As, en este captulo se analizan las posibilidades de los EC que se asocian no a EIs sino a respuestas reforzadas, o sea, los estmulos antecedentes de la respuesta instrumental. En lo referente al condicionamiento instrumental aversivo, trataremos en este captulo aquellas tareas y procedimientos de aprendizaje en donde se utilice estimulacin aversiva, sobre todo condicionamiento instrumental. En captulos anteriores estudiamos procesos y tareas de aprendizaje en los cuales los eventos significativos eran positivos (gratificantes o reforzantes). Sin embargo, una gran parte de la conducta que se aprende va dirigida no ya a obtener consecuencias positivas sino a eliminar, reducir o evitar situaciones desagradables. Analizaremos el condicionamiento instrumental con refuerzo negativo (escape y evitacin), tanto en sus aspectos de adquisicin como de extincin. Tambin estudiaremos procedimientos aversivos inhibitorios o que reducen la tasa de respuesta (castigo) y por ltimo, el efecto de la estimulacin aversiva no contingente en lo que se denomina indefensin aprendida.

Lecturas complementarias Referente al control de estmulo, vanse los manuales de Hilgard y Bower (1966; trad. 1976, pp. 562-585), Hulse et al. (1980; trad. 1982, cap. 7), Kimble (1961; trad. 1969; 377-452), Marx (1969; trad. 1976; pp. 297-424), Rachlin (1976; trad. 1979, pp. 456-483), Tarpy (1981; trad. 1986, cap. 9), Wittig (1982, pp 119-136), y el captulo de Arias Holgado, Benjumea y Fernndez Serra (1997). Sobre control de estmulos desde un punto aplicado es til Sulzer-Azaroff y Mayer (1977; trad. 1983) y tambin el captulo de Navarro Guzmn (1994). Para cuestiones de escape, evitacin y castigo hay buenos captulos en Hulse et al. (1980; trad. 1982, pp. 167-207), Mackintosh (1983; trad. 1988, caps. 5 y 6), Pelechano (1980), Rachlin (1976; trad. 1979, caps. 5 y 9), Tarpy (1975; trad. 1977), pp. 125-186), Fernndez Castro (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) sobre indefensin es imprescindible la lectura del libro de Seligman (1975; trad. 1980) y las revisiones de Vazquez-Valverde y Polaino (1982), de Ferrndiz (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) . Tambin es muy ilustrativo el texto de Gray (1988; trad. cast. 1993) y el manual de Klein (1991; trad. cast. 1994, pp. 201-250)

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

237

1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE CLAVES CONTEXTUALES ANTECEDENTES 1.1. Introduccin 1.1.1. El aprendizaje de seal en el condicionamiento instrumental
En los temas precedentes de aprendizaje mediante condicionamiento hemos analizado situaciones en las que los resultados externos del aprendizaje (cambios conductuales) se hacan depender de las consecuencias estimulares (condicionamiento clsico) o de la accin (condicionamiento instrumental) pero en fenmenos separados y diferentes de aprendizaje. Sin embargo, es un hecho que la conducta no se da "en el vaco" (Mackintosh, 1977; p. 643, trad. esp., 1983) sino en un determinado contexto que est presente en el momento de emitir la respuesta y que puede influir en ella. Estos componentes del contexto que influyen en la respuesta se denomina, en la terminologa conductista, condiciones antecedentes. Estas condiciones pueden ser de dos tipos: motivacionales y estimulares: - Las primeras tienen, como sabemos (ver Tema 1), un valor activador (por ejemplo, es necesaria una cierta privacin de comida para que la rata inicie el condicionamiento) y no se van a tratar aqu. - Las condiciones antecedentes estimulares forman parte del contexto, ambiente o estimulacin previa o concomitante a la respuesta. As, la correlacin accin-consecuencia, necesaria para el aprendizaje de respuestas (condicionamiento instrumental) se convierte en un aprendizaje ms completo si consideramos la correlacin ANTECEDENTES - ACCION - CONSECUENCIA o, lo que es lo mismo, E-R-C (estmulo - respuesta - consecuencia). Es ms completo pues combina condicionamiento clsico y condicionamiento instrumental, o sea,
(ESTMULO CONSECUENCIA) + (RESPUESTA CONSECUENCIA) = ESTMULO RESPUESTA CONSECUENCIA

En el condicionamiento clsico se produca un aprendizaje de seal, es decir, el EC activaba expectativas de consecuencia estimular favorable o desfavorable y con ello desencadenaba ms o menos automticamente la respuesta. Tambin en el condicionamiento instrumental con estmulos discriminativos -es decir, en el aprendizaje de respuestas sealizadas o tambin aprendizaje instrumental sealizado-, se hace un aprendizaje de seal (donde el EC se denomina ahora estmulo discriminativo o ED), pero la seal activa en la memoria no la representacin aislada de la consecuencia sino la representacin conjunta de accin - consecuencia (R-C). El esquema de esta comparacin es el siguiente:
Tipo de condicionamiento Condicionamiento clsico: Condicionamiento instrumental: Seal observable EC ED Representacin activada EI (R-C)

El aprendizaje instrumental sealizado tiene pues dos niveles de complejidad: - Que la respuesta se desencadene tras la aparicin del estmulo antecedente, es decir, que un estmulo ambiental cualquiera se convierta en seal predictiva para R-C. Esto es lo que podramos llamar adquisicin inicial del control de estmulo. - Que, una vez sealizada la conducta, sta se pueda realizar ante otras seales ms o menos parecidas. Se trata de adquirir la sealizacin especfica (discriminacin) o la sealizacin amplia (generalizacin). En cualquier caso, se adquiere control de estmulos: en un caso control de estmul os discriminativos y en otro, control de estmulos generalizados o extensin del control a otros estmulos similares.

238

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

1.1.2. El aprendizaje de seal como control de estmulos


En los manuales de psicologa del aprendizaje, este aprendizaje instrumental sealizado aparece en temas con epgrafes del tipo "generalizacin y discriminacin" y tambin "control de estmulos". Esta ltima denominacin, si bien procede del enfoque operante skinneriano -Terrace (1966) fue el primero en utilizarla- , aqu, siguiendo entre otros a Rilling (1977) y Mackintosh (1977), va a tener un sentido ms amplio, neutro e integrador de los anteriores. Procederemos en este apartado a una delimitacin conceptual de estos trminos. Desde un punto de vista estrictamente skinneriano, se dice que una respuesta est bajo el control de un estmulo (generalmente denominado estmulo discriminativo, ED) cuando la probabilidad de que ocurra dicha respuesta es mayor en presencia de dicho estmulo que en su ausencia. Naturalmente, esta mayor probabilidad de respuesta ante el estmulo ocurre siempre que se establezca una experiencia previa de correlacin entre estmulo antecedente - accin - consecuencia positiva. Por tanto "control" aqu se entiende como mayor posibilidad de prediccin de que se emitir la respuesta en presencia de ese estmulo (y no como obligatoriedad o necesidad de emitir la respuesta ante ese estmulo). La forma de comprobar que se ha producido la adquisicin de control de estmulo es si existe diferente tasa o probabilidad de respuesta en presencia de distintos estmulos (mayor ante ED que ante otros estmulos).

1.1.3. Variaciones en las condiciones antecedentes y resultados de generalizacin y discriminacin


Una vez establecida la correlacin estmulo-accin-consecuencia (si estamos en el condicionamiento instrumental) o la correlacin estmulo-consecuencia (si se trata del condicionamiento clsico), el control de estmulo puede darse ante ms o menos estmulos en funcin del tipo, cualidad o magnitud de los estmulos antecedentes y de las consecuencias que tenga la conducta ante cada uno de ellos. As es como se puede lograr la especificidad (discriminacin) o la extensin de la capacidad sealizadora a otros estmulos (generalizacin). Estas dos posibilidades deben entenderse como resultados conductuales de dichas manipulaciones. Ambos conceptos se configuran como dos extremos de un continuo. En un extremo, el incremento de respuesta ante diversos estmulos parecidos (generalizacin) y, en otro, ante estmulos muy especficos (discriminacin). En cualquier punto del continuo siempre se tenemos estmulos antecedentes que controlan (predicen) respuestas, es decir, que son capaces de predecir una alta probabilidad de ocurrencia de las mismas en su presencia. En cierto sentido, la adquisicin del control de estmulo suele requerir una discriminacin de estmulos. Ahora bien, lo que se trata de aprender es el grado en que varios (generalizacin) o un solo estmulo (discriminacin) son capaces de sealizar la respuesta (y por tanto responsables del control de estmulo). Obviamente, entendemos que a medida que aumenta la generalizacin, disminuye la discriminacin, y viceversa. Discriminacin y generalizacin son fenmenos opuestos porque mantienen una relacin inversa. El control de estmulos, y sus aspectos de discriminacin y generalizacin, es un proceso con un gran valor adaptativo para el hombre (y otras especies). Se trata de aprender a responder selectivamente ante determinados estmulos (por sus consecuencias gratificantes) y a no responder ante otros (por sus repercusiones aversivas o simplemente por su falta de repercusiones).

1.1.4. Implicaciones prcticas del aprendizaje instrumental sealizado


La palabra "antecedentes" aqu tiene una dimensin temporal amplia en cuanto al momento del establecimiento de la correlacin con la accin y/o con la consecuencia. En cualquier caso, una vez re-

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

239

presentada en la memoria esta expectativa de relacin triple (estmulo antecedente, accin, consecuencia), la mera aparicin del antecedente servir para desencadenar la accin, convirtindose as en seal o indicio de que la accin tendr una consecuencia positiva y permitiendo una proximidad temporal entre el antecedente y la accin. Como dicen Domjan y Burkhard (1986), es tan habitual el control de estmulos que no pensamos en la cantidad de veces que lo aplicamos y lo raro que resultara -por no decir anormal o patolgico- el mostrar conductas que no estn bajo el control de estmulos. Citan cuatro ejemplos y contraejemplos interesantes: - La conducta de desnudarse para cambiarse de ropa se hace en la intimidad del dormitorio y no en medio de la calle, - se mira la TV si est encendido el aparato y no si est apagado, - se tiene una interaccin cariosa (caricias, besos) con familiares prximos y no con desconocidos, - se grita en un partido de ftbol y no en clase o en la biblioteca. En todos estos casos, la conducta se hace cuando se est en el contexto adecuado y no en otros momentos. Eso es control de estmulos o aprendizaje instrumental sealizado. Pero hay ms ejemplos: Al circular en coche por la carretera, una seal de STOP es ED, antecedente o indicio inmediato de que si se realiza la respuesta (parar) se obtendr una consecuencia (no peligro); en este caso (que aunque es ms bien de evitacin sirve igualmente en este momento), la conexin entre ese estmulo, la respuesta y la consecuencia pudo aprenderse hace tiempo (al estudiar para la obtencin del carnet de conducir, por ejemplo) pero es obvio que la aparicin del estmulo genera inmediatamente una mayor probabilidad de respuesta. El tema es pues de gran importancia terica y sobre todo prctica. La conducta adaptativa se caracteriza, entre otras cosas, por producirse "en el momento oportuno" (Hulse, Egeth y Deese, 1982; p. 206) y el momento oportuno para responder slo lo puede anticipar el sujeto si aparecen las correspondientes seales de ello. Ser ms probable que una accin tenga consecuencias adaptativas cuando se sabe cundo y en qu lugar y en presencia de qu eventos se debe realizar. Por citar ms ejemplos, en clase el alumno no habla (respuesta de "estar atento y en silencio") cuando-el-profesor-expone-eltema (ED), cruzamos la calle (respuesta) cuando el-semforo-est-en-verde (ED), escribimos (respuesta) cuando observamos salir la tinta (ED) del bolgrafo al rozar su punta sobre el papel. Ahora bien, cogemos el telfono (respuesta) cuando omos el timbre (ED) pero no si omos el timbre de la puerta (discriminacin) y decimos "mesa" (respuesta) cuando dicho conjunto de letras lo vemos escrito con maysculas o con minsculas o en cursiva (generalizacin). El situar la accin bajo el control del o de los estmulos es un aprendizaje bsico. En la mayora de situaciones cotidianas es una conducta o hbito sobreaprendido (o aprendido hace mucho tiempo), pero en otras tenemos que activar continuamente estrategias que logren un control del estmulo. Por ejemplo, ante un aparato no muy conocido (video, ordenador, equipo de msica, etc. ), su manejo inicial (respuesta) es dificultoso y debe ponerse bajo el control de estmulo para aprenderlo, y para ello ponemos en marcha distintas estrategias (leer las instrucciones, buscar a un experto y que nos explique el manejo, mtodo de ensayo y error, etc.). Pero hay conductas muy complejas para cuya realizacin se requiere un sofisticado y laborioso control de estmulo que tarda tiempo en establecerse. As, la conducta lectora exige situarse ante un texto escrito, fijar los ojos en los smbolos grficos adecuados y emitir los sonidos correspondientes. El lector maduro tiene un adecuado control de estmulo pero el nio que aprende a leer necesita ayuda (profesores, mtodos especiales de presentacin de estmulos en cartillas, dosificacin de dificultad, etc. ). Hay una serie de mtodos generales desarro llados para instigar inicialmente el hecho de que la conducta se site bajo el control del estmulo. As pues dedicaremos este captulo al aprendizaje instrumental sealizado o control de estmulos, para lo cual estudiaremos los procedimientos de adquisicin, las condiciones, teoras y procesos y tcnicas aplicadas.

240

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

1.2. Tcnicas experimentales 1.2.1. Tcnicas simples: el refuerzo diferencial


As como el caso de un estmulo reforzante su efectividad es casi automtica para aumentar la probabilidad de emisin de la respuesta, no ocurre as con los ED. Estos inicialmente no sealizan nada y por tanto se necesita un perodo de adquisicin de dicha funcin. Para conseguir que un estmulo adquiera la funcin de ED, el procedimiento ms usado es el refuerzo diferencial discriminativo. Se lleva a cabo mediante dos operaciones bsicas: - reforzar una respuesta emitida en presencia del estmulo o estmulos particulares, que queremos que se conviertan en ED . - no reforzar dicha respuesta si ocurre en ausencia de dichos estmulos o ante otros diferentes (E ). Un ejemplo es el experimento original de Guttman y Kalish (1956) en palomas. El procedimiento inclua dos fases: I) Fase de entrenamiento: Al picotear un disco iluminado las palomas reciban refuerzo continuo. Se vari la intensidad de luz del disco y as se hicieron cuatro grupos de palomas, uno para cada intensidad -530, 550, 580 y 600 nanmetros (nm, medida de longitud de onda)-. II) Fase de prueba: Para cada grupo, el disco se iluminaba con 11 diferentes longitudes de onda (de 470 a 640 nm.), con una duracin en cada caso de 30 segs. La respuesta era reforzada slo tras uno de los 11 estmulos presentados (convirtindose as en ED). Hubo 12 ensayos para cada estmulo. El resultado fue una mayor probabilidad de respuesta ante el ED que ante los otros estmulos y una fuerza de respuesta en forma de U invertida (el pico de respuesta mxima ante ED), formando as lo que denominaron un gradiente de generalizacin.

1.2.2. El gradiente de generalizacin / discriminacin


La mejor tcnica para evaluar el grado de generalizacin o discriminacin que se produce en la adquisicin del aprendizaje instrumental sealizado es la del gradiente de generalizacin / discriminacin. Es un procedimiento iniciado por Guttman y Kalish (1956) que presenta los resultados en trminos de representacin grfica de la fuerza (intensidad o frecuencia) de la respuesta dada al estmulo original y a otros estmulos semejantes. El grado de generalizacin de estmulo se aprecia en la magnitud o frecuencia de respuesta. Cuanto menos similar sea el nuevo estmulo al estmulo original menor ser la fuerza de la respuesta, y esto ocurre de forma graduada siguiendo un patrn determinado que se presenta grficamente en forma de U invertida. Adems, como ya dijimos que generalizacin y discriminacin son extremos opuestos de un continuo, ambos fenmenos pueden evaluarse en un mismo gradiente. En la Figura 1 tenemos un ejemplo de gradiente de generalizacin en dos de sus manifestaciones extremas: cuando se da mucha generalizacin (a) y cuando es escasa, y por tanto hay una gran discriminacin (b).

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

241

Fuerza de la respuesta

E original (a)

E original (b)

Intensidad o frecuencia (c) E1 E2 E3 E4

Figura 1: Representacin grfica de dos tipos de gradientes de generalizacin.

En el grfico (a) de la figura anterior, se produce una amplia dispersin de la generalizacin de estmulo como forma de responder a diversos estmulos. En el caso del grfico (b) se produce una respuesta diferenciada y por tanto una escasa generalizacin de estmulo. La representacin grfica (c) es otra forma de exponer grficamente el gradiente de generalizacin. Adems de estos gradientes excitatorios, tambin es posible lograr gradientes inhibitorios o gradiente de extincin. Un ejemplo es el experimento de Honig (1961) con palomas. Tena tres fases: I) Fase preliminar, en la que se estableca una lnea base de adquisicin mediante refuerzo de una respuesta de picoteo de un disco iluminado con 13 longitudes de onda diferentes (de 490 a 630 nm). El animal responda pues ante los 13 estmulos. II) Fase de extincin: ante uno (E ) de los 13 estmulos (570 nm) la respuesta nunca era reforzada. III) Prueba de generalizacin: Se volvan a presentar los 13 estmulos. Los resultados, presentados grficamente en el correspondiente gradiente muestran una funcin en U, siendo el pico inferior la respuesta ante E .

2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS GENERALIZADOS 2.1. Procedimientos de estudio de la generalizacin
El procedimiento bsico es tambin de refuerzo diferencial, midiendo las tasas de respuesta que se dan tras cada estmulo, antes y despus de ser reforzada la respuesta. Se trata pues de comparar tasas de respuesta en presencia de diferentes estmulos. Hay dos grupos de tcnicas diferentes: las que suponen presentar estmulos diferentes a los mismos sujetos y las que hacen presentar el mismo estmulo a distintos grupos de sujetos: - El primer tipo de tcnica es la del estmulo repetido, segn la cual se presentan estmulos distintos (pero similares al condicionado) en orden aleatorio. Tiene el inconveniente de que la respuesta ante uno de los estmulos puede verse muy influida por las consecuencias de las respuestas ante los otros. - El segundo tipo de tcnica se llama tcnica del estmulo nico: se divide al grupo experimental en subgrupos y cada uno de ellos recibe slo un estmulo (diferente para cada grupo); se comparan las tasas de respuestas de los distintos grupos entre s.

242

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

2.2. Tipos de generalizacin


La generalizacin puede ser, en general, de dos tipos: generalizacin de estmulo y de respuesta. En la primera es la misma respuesta la que surge ante otros estmulos distintos del inicialmente condicionado; en la segunda es una primera respuesta reforzada la que provoca que aparezcan respuestas parecidas.

2.2.1. Generalizacin de estmulo


Mediante procedimientos de la generalizacin de estmulo, una misma respuesta podr realizarse ante situaciones o contextos no idnticos pero similares a aquellos en que tuvo lugar el entrenamiento. Es decir, el reforzamiento de una respuesta ocurrida siempre en presencia de un mismo estmulo, provoca que dicha respuesta se pueda producir ante parecidos estmulos. Por ejemplo, un nio puede mostrar temor como respuesta a un mdico, debido a una asociacin del mdico con el dolor producido por una inyeccin y luego tendr miedo ante cualquiera que lleve bata blanca. El grado de generalizacin del estmulo principalmente depende del grado de similaridad del nuevo estmulo bajo el cual tambin se emiti la respuesta. Algn autor (Wittig, 1982, p. 119) distingue dos tipos de generalizacin del estmulo: - Generalizacin primaria, en la que el organismo responde no slo al estmulo original sino a otros con propiedades fsicas similares. Por ejemplo, una rata entrenada a responder al tic-tac del metrnomo puede responder tambin al golpeteo de una varilla en un bloque de madera. - Generalizacin secundaria, segn la cual un organismo responde a un estmulo debido a alguna equivalencia aprendida entre los dos. Por ejemplo, un sujeto entrenado a responder a la palabra "alto" puede tambin responder a la palabra "pare". Es algo similar al condicionamiento de segundo orden en el condicionamiento clsico. La generalizacin de estmulos es un fenmeno conductual omnipresente. Gracias a l no tenemos que aprender constantemente una respuesta ante cada estmulo nuevo sino que ante estmulos similares damos una respuesta semejante. De este modo, un maestro puede pretender que el alumno aprenda a leer, por ejemplo la letra A, no slo con la grafa propia de la cartilla escolar sino en cualquier otra grafa. La generalizacin tiene pues ventajas para el aprendizaje pero tambin algn inconveniente. En trminos positivos, proporciona estabilidad al comportamiento y tiene por tanto gran valor adaptativo. En trminos negativos y segn las condiciones especficas, puede entenderse como una mala discriminacin o una discriminacin todava mal lograda.

2.2.2. Generalizacin de respuesta: Moldeamiento o aproximaciones sucesivas


La generalizacin de respuesta consiste en un aumento de probabilidad de ocurrencia de otras respuestas parecidas a la reforzada. El reforzamiento de una respuesta aumenta la probabilidad de otras respuestas similares. En esto se basa el mtodo de moldeamiento (shaping), muy utilizado en modificacin de conducta -y tambin como procedimiento experimental para la adquisicin rpida del condicionamiento de recompensa; vase aptdo. 1.4.2.a del Tema 4)-.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

243

Se basa en el refuerzo de cada respuesta que se parezca o aproxime a una "respuesta terminal" o conducta objetivo seleccionada de antemano. Se emplea el moldeamiento o mtodo de aproximaciones sucesivas cuando la respuesta terminal no se da habitualmente en el repertorio comportamental del sujeto. As, si uno es reforzado por sonrer, aumenta la frecuencia de la risa y quizs de otras respuestas tales como la conversacin. O sea, la alteracin en la frecuencia de una respuesta puede influir de forma inadvertida en otras. En resumen el esquema que corresponde a ambos tipos de generalizacin sera el que se muestra en la Figura 2.
GENERALIZACION DE ESTIMULO E1 E1 E2 E3 R1 Eref GENERALIZACION DE RESPUESTA E1 R1 Eref R1 R2 R3

R1

E1

Figura 2: Esquema sobre los tipos de generalizacin.

2.3. Por qu la generalizacin (teoras explicativas)


Las tres teoras explicativas ms clsicas son las siguientes: a) Teora de Hull: Segn Hull (1943), la generalizacin es un proceso primario inherente al condicionamiento. Las respuestas durante la adquisicin son condicionadas no a un simple estmulo sino a lo que l llama una "zona" de estmulos. Todos los estmulos en la zona son similares, esto es, se relacionan a travs de un continuum sensorial particular de diversas intensidades pero dentro de una misma modalidad sensorial y todos se vinculan a la respuesta. El hecho de que ms de un estmulo sea capaz de elicitar una respuesta se hace evidente en una prueba de generalizacin donde se presente una variedad de estmulos a travs de un continuum sensorial. b) Teora de Lashley y Wade: Para Lashley y Wade (1946), la generalizacin ocurre porque el sujeto no consigue discriminar entre estmulos; la generalizacin resulta pues de una discriminacin imperfecta. Las respuestas se daban meramente porque los sujetos no discriminaban adecuadamente entre el estmulo original y los estmulos generalizados. Si el sujeto puede distinguir entre estmulos, no los confunde y consecuentemente no puede generalizar. c) Teora de la generalizacin mediada de Osgood: Segn Osgood (1953), pueden hacerse equivalentes ciertos estmulos diferentes (es decir, evocar la misma respuesta) si suscitan la misma respuesta mediadora. Esta respuesta es un eslabn intermedio e interno de la cadena general de eventos que comienza con el estmulo y acaba con la respuesta. El aprendizaje perceptivo temprano produce estas respuestas mediadoras implcitas. Es claro que los estmulos fsicamente similares suscitan la misma respuesta mediadora en mayor medida que los estmulos diferentes. La hiptesis de la mediacin viene representada en la Figura 3. Ambos estmulos evocan la misma respuesta mediadora (rm), acompaada a su vez de un estmulo mediador interno (em). Durante la adquisicin, em es el ltimo eslabn antes de R, al igual que ante el estmulo generalizado.

244

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

1. Desarrollo de la respuesta mediadora 2. Adquisicin 3. Prueba de generalizacin

EC1 EC2 EC1 EC2

rm rm rm rm

em em em em R1

Figura 3: Hiptesis de la generalizacin mediada de Osgood.

3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS 3.1. Tcnicas simples: Refuerzo diferencial discriminativo
Segn Millenson y Leslie (1979, pp. 247-248), el paradigma bsico de discriminacin consta de una respuesta (R) y dos condiciones de estmulo (ED y E ). La R es reforzada en presencia de uno de los estmulos, el ED, y no es reforzada en presencia de la otra condicin estimular, el E (con lo cual se extinguir dicha R). El resultado es que la probabilidad de responder ante E D se hace mayor que ante E . Dichas condiciones podran representarse del siguiente modo: ED - R E -R / Eref no Eref

donde = "es seguida por"; / = "no hay consecuencias programadas". E se usa tambin para denotar condiciones no slo de ausencia de refuerzo (extincin) sino de menor refuerzo que para ED. El refuerzo diferencial tiene en el contexto experimental dos variantes: La tcnica de discriminacin simultnea y la de discriminacin sucesiva: TCNICA DE DISCRIMINACIN SIMULTNEA Se presentan los dos estmulos (ED y E ) al mismo tiempo y se refuerza la eleccin correcta. Es la tcnica usada por Lashley (1930) en su trampoln de saltos con ratas: La rata salta a una u otra de las puertas, si la eleccin es correcta se abre la puerta y el animal llega a la comida, si no lo es, al saltar no se abrir la puerta. En la Figura 4 podemos apreciar dicho dispositivo. DISCRIMINACIN SUCESIVA Se presentan sucesiva y alternativamente ambos estmulos y se refuerza la respuesta slo ante E D y no ante E . Tanto en el caso de la discriminacin simultnea como de la sucesiva, se consigue un aumento de la tasa de respuesta en presencia de ED y un cese progresivo y desaparicin de la respuesta ante E . As es como el sujeto ha aprendido a dar respuesta selectiva ante un estmulo, o lo que es lo mismo, ha aprendido a "discriminar" dicho estmulo, lo distingue de otros, da ante l una respuesta distinta que ante otros estmulos.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

245

Figura 4: Dibujo esquemtico del dispositivo de discriminacin de Lashley.

3.2. Tcnicas complejas de adquisicin de discriminacin


En el estudio de la discriminacin se han utilizado otros procedimientos ms complejos, algunos de los cuales tienen aplicaciones prcticas importantes. Citaremos slo tres de ellos:

3.2.1. Atenuacin o desvanecimiento del estmulo


El desvanecimiento (fading) implica que se deben hacer desaparecer progresivamente a lo largo del entrenamiento determinadas caractersticas de un ED (forma, color, situacin, tamao) que el sujeto discriminaba desde el principio con facilidad. stas van desapareciendo, "atenundose" poco a poco, a la vez que se produce un aumento de intensidad de otras caractersticas del mismo estmulo, las cuales hacen de nuevo ED. Este procedimiento permite obtener aprendizajes discriminativos muy complicados. Se parte de caractersticas estimulares que un sujeto ya conoce y se llega a otras que antes no discriminaba. As, por ejemplo, cuando el nio empieza a escribir traza las letras por encima de los punteados y dentro de los renglones marcados en su libreta de aprendizaje. Poco a poco, se irn eliminando los punteados de las letras y tambin los renglones que delimitan el tamao y ordenamiento de la escritura, hasta que la simple instruccin del profesor para escribir una letra o palabra sobre un folio en blanco sea un ED suficiente. Una variante compleja de desvanecimiento es la tcnica de discriminacin sin error. Se trata de un fenmeno descubierto por Terrace (1964). Para lograr esa discriminacin sin error, a los sujetos se les presenta ED y E , generalmente el ED con la mayor fuerza posible y el E con una intensidad muy dbil. Las respuestas al ED se refuerzan y se incrementan pero se logra que el sujeto no d ninguna respuesta no reforzada al otro estmulo, puesto que, al principio, E no tiene igual fuerza que ED sino mucho menor, de modo que el E empieza por ser irrelevante en el medio ambiente del sujeto, y aunque despus vaya aumentando en intensidad, ya ser muy difcil responder ante E si a la vez se ha reforzado la respuesta ante ED. Es pues un procedimiento gradual mediante el cual se vigoriza la fuerza de la respuesta a un ED, a la vez que no se permiten respuestas no reforzadas al E . Terrace lo consigui en palomas "desvaneciendo" el E al principio y hacindolo cada vez ms fuerte a lo largo del entrenamiento. Hay pues una presentacin progresiva del E : al principio muy distinto del ED y conforme avanza el proceso de aprendizaje se parece ms al ED (por ejemplo, de presentarse durante dcimas de segundo pasa a durar lo mismo que ED). Siendo todas las respuestas correctas y reforzadas ante ED se consigue que no apa-

246

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

rezca ninguna respuesta ante E (no hay frustracin al no haber errores, al no darse respuestas que no vayan seguidas de recompensa) y se puede llegar a un grado de discriminacin muy elevado. En el mbito aplicado la utilizacin de desvanecimiento es fundamental cuando se aplican instigadores (vase apartado 5).

3.2.2. Comparacin con la muestra


Es una tcnica de discriminacin que tiene dos variantes: igualacin y diferenciacin de la muestra. - Igualacin a la muestra: Consiste en utilizar, en primer lugar, el estmulo objetivo que se tiene que discriminar (denominado estmulo de muestra) y despus presentarlo junto a otros estmulos parecidos. La recompensa se dar cuando el sujeto elija precisamente el idntico al de muestra. - Diferenciacin de la muestra: Se presenta un estmulo muestra y una serie de alternativas que son todas iguales a la muestra excepto una que es la que se refuerza cuando es elegida. Son procedimientos que suele emplearse en la reeducacin de "dficits perceptivos" y trastornos asociados con la percepcin. La Figura 5 nos muestra un ejemplo de aplicacin de estas tcnicas en el aprendizaje de la lectura.

1 se presenta:

Estmulo de muestra Si seala este E, se da refuerzo muestra

Igualacin con la muestra

2 se presentan:

d p q b h b
Diferenciacin de la muestra

1 se presenta:

Estmulo de muestra

Si seala este E, se da refuerzo muestra

2 se presentan:

b d b b b
Figura 5: Ejemplos de aplicacin de tcnicas de igualacin y diferenciacin a la muestra

3.2.3. Combinacin de ED y refuerzo secundario: el encadenamiento


Otro caso en el que interviene la discriminacin es en el procedimiento de encadenamiento. Esta es una tcnica experimental y tambin aplicada (en modificacin de conducta), utilizada en la adquisicin

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

247

de conductas nuevas. Es un procedimiento basado en el concepto de refuerzo condicionado o secundario, ya explicado en el Tema 4. El encadenamiento es un procedimiento que consiste en ordenar secuencias o cadenas continuas de estmulos y respuestas mantenidos en unin por estmulos que tienen una doble funcin: como refuerzo secundario y como ED. Una cadena de este tipo est compuesta de eslabones, cada uno de los cuales consta de una secuencia de ED - RESPUESTA - REFUERZO CONDICIONADO. Se exige tambin que el primer elemento de la cadena sea un ED, que el resto de estmulos discriminativos sean a su vez refuerzos condicionados y que el ltimo refuerzo de la cadena sea primario. Un ejemplo sera el siguiente: Un chimpanc opera una mquina mediante la cual recibe una ficha que cambia a continuacin por alimento. La cadena sera la que encontramos en la Figura 6.
E1D R1 ED Ref. cond. 1
(ficha)

(mquina)

(operar mquina)

R2
(cambiar ficha por uva)

Eref
(uva)

Figura 6: Ejemplo de encadenamiento

Otro ejemplo sera la secuencia de respuestas para ir a un restaurante: 1) ED (llamada telefnica de un amigo, hora del da, hambre). 2) Varias respuestas secuenciadas (levantarnos, abrir la puerta, salir de casa, entrar al coche, conducir, aparcarlo, entrar al restaurante, sentarnos, leer el men, pedir la comida, comerla). El estmulo ambiental que sigue a cada respuesta da ocasin a la siguiente respuesta de la cadena. 3) La cadena total est mantenida por la comida que finalmente comemos. As pues en resumen, el encadenamiento sigue los siguientes pasos: 1) Presentacin de un ED 2) Respuesta en presencia de ED 3) Aparicin consiguiente de otro E que es refuerzo condicionado respecto al paso anterior y ED para... 4) ... una nueva respuesta 5) Estmulo nuevo que es refuerzo condicionado y ED ... etc. ... n) El ltimo estmulo que forma la cadena es un reforzador primario o innato. Para un uso aplicado de este procedimiento vase el libro de Sulzer-Azaroff y Mayer (1977).

3.3. Por qu ocurre la discriminacin (teoras explicativas)


Hay dos teoras clsicas fundamentales: a) Teora de la continuidad de Hull-Spence. Elaborada por Hull (1943) y Spence (1936), puede considerarse la ms antigua y tradicional teora en torno a la discriminacin. Tiene tres principios bsicos: 1, el refuerzo conduce a un incremento de la fuerza excitatoria del ED; 2, el refuerzo aumenta la fuerza inhibitoria del ED; 3, ambas tendencias (excitatorias e inhibitorias) se generalizan a otros estmulos similares y los gradientes se suman para producir la respuesta diferencial. Esta teora ha sido criticada recientemente dando paso a otra ms actual: la teora atencional.

248

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

b) Teora atencional. Es original de Sutherland y Mackintosh (1971). Segn dicha teora, el aprendizaje discriminativo implica dos procesos discretos: el refuerzo de la atencin a una o ms dimensiones relevantes del estmulo y la concesin de una respuesta particular al estmulo relevante. El sujeto aprende dos cosas durante los experimentos de discriminacin: 1, aprende a atender a las dimensiones particulares del ambiente sobre la base de que las consecuencias de dicha atencin predicen correctamente importantes eventos (posible refuerzo ulterior a la respuesta); y 2, aprende a responder en funcin del refuerzo.

4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS


Varios autores (Tarpy y Mayer, 1978; Wittig, 1982) sealan diversas condiciones importantes para la adquisicin del control de estmulos. Dado que generalizacin y discriminacin son extremos de un continuo, lo normal es que la condicin que favorece a una dificulte a la otra. Por eso, aunque los manuales separan las condiciones para un tipo u otro de control de estmulos, creemos preferible unirlas agrupndolas en: condiciones durante la adquisicin y condiciones de entrenamiento previo en discriminacin.

4.1. Condiciones durante la adquisicin


a) Grado de adquisicin o nmero de ensayos de aprendizaje Cuanto menor sea el grado de adquisicin, es decir, el nmero de presentaciones del estmulo, ms fcil es la generalizacin. Si prosiguen los ensayos el gradiente se hace ms puntiagudo y por tanto hay mayor discriminacin. b) Intervalo entrenamiento-prueba Cuanto mayor es el perodo de tiempo entre la adquisicin de la respuesta ante un estmulo y la prueba ante otros estmulos, mayor es la generalizacin, es decir, los estmulos generalizados se elicitan relativamente ms siempre que se responda inmediatamente despus de un descanso tras el entrenamiento. De alguna manera, la recencia del entrenamiento aumenta el aprendizaje discriminativo, favorece el recuerdo especfico de los estmulos discriminativos. c) Topografa de los estmulos Cuanto mayor semejanza exista entre el estmulo original y los estmulos con los que queremos que haya generalizacin mayor intensidad y frecuencia de la respuesta ante stos, lo cual resulta bastante lgico si tenemos en cuenta que la generalizacin consiste precisamente en esa extensin de la respuesta ante estmulos semejantes al ED original. d) Dificultad del problema El aprendizaje discriminativo ocurre rpidamente cuando se usan estmulos que se distinguen fcilmente, pero es ms lento cuando son muy parecidos. As, un nio encontrar ms fcil distinguir entre "O" e "I" que entre "F" y "E" o entre b y d (vase Figura 7).

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

249

La habilidad para responder diferencialmente a dos estmulos est limitada por las capacidades perceptivas del sujeto para distinguir entre ambos. De este modo, si los estmulos son demasiado parecidos como para que los pueda distinguir un determinado organismo, puede llegarse a lo que desde Pavlov se viene llamando "neurosis experimental" (al exigir discriminaciones entre estmulos con propiedades cada vez ms similares) con sntomas en perros debidos a la incapacidad de discriminacin, tales como angustia, confusin, etc. El experimento tpico de la escuela de Pavlov -Shenger-Krestovnika (1921; cit. por Gray, 1988; 1993, trad. cast., p. 152)- consista en mostrarle al perro un crculo (EC) y luego darle comida, obteniendo as una RC de salivacin; se le muestra tambin una elipse pero no se le da comida y no se obtiene RC; cuando el cociente de los ejes de la elipse se redujo a 9:8, el perro no diferenciaba entre el crculo y la elipse; durante tres semanas su ejecucin fue correcta en otros casos pero luego cambi, cometiendo errores en discriminaciones ms simples e incluso mostrando signos de angustia (ladridos, agitacin, etc.). e) Informacin estimular Nos referimos con ello a las propiedades informativas del estmulo, es decir, si el estmulo produce informacin sobre la recompensa o la no recompensa. Cuanto mayor valor informativo tenga el estmulo mejor se producir la discriminacin. f) Aprendizaje observacional O sea, la oportunidad para el aprendiz de observar a otro sujeto (el modelo) cmo ejecuta la respuesta ante el estmulo. Si se da esta oportunidad, mejor se producir el aprendizaje discriminativo.

4.2. Condiciones de entrenamiento previo en discriminacin


a) Experiencia sensorial temprana Diversos estudios (como sealan Tarpy y Mayer, 1978; p. 149) han demostrado que los estmulos generalizados elicitan respuestas incluso en sujetos que tuvieron experiencia previa del estmulo muy limitada, desde un ao despus de su nacimiento. Este hallazgo es importante pues sugiere que la exposicin previa a los estmulos generalizados no es condicin necesaria para la respuesta a aquellos estmulos. No obstante, si la experiencia previa de dichos estmulos es muy reciente la generalizacin es menor. b) Dificultad de la generalizacin por entrenamiento previo en discriminacin El efecto del entrenamiento previo en discriminacin sobre la generalizacin ha sido estudiado extensamente. Una razn para el inters en dicha rea fue el hallazgo de que los gradientes de generalizacin pueden predecirse a partir de las capacidades discriminativas del sujeto; un mayor gradiente de discriminacin representa mayor habilidad para distinguir entre estmulos, y a la inversa, lo cual sugiere que el entrenamiento explcito en discriminacin, previo a la prueba de generalizacin, debe agudizar el gradiente, esto es, produce menor generalizacin de respuesta.

250

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

c) Transferencia del entrenamiento en discriminacin Se trata de situaciones en las cuales el aprendizaje de una tarea influye en la adquisicin posterior de alguna otra. Se ha demostrado que si se aprende una discriminacin relativamente fcil antes de aprender otra relacionada ms difcil, la discriminacin facilitar la adquisicin de la segunda tarea. d) Entrenamiento previo ED - E : El fenmeno de desviacin del vrtice Tambin denominado "cambio de pico" (peak shift), fue descubierto inicialmente por Hanson (1959) y se refiere al hecho de que tras un entrenamiento en discriminacin seguido por un entrenamiento inhibitorio con E , la fuerza de una respuesta puede desplazarse lejos de la direccin de un E y ms all de un ED original, aun cuando el ED contine manteniendo sus propiedades. En la Figura 8 podemos apreciar que las respuestas reforzadas ante el ED y de extincin al E generan un gradiente de generalizacin del estmulo que no es simtrico, teniendo la mayor parte de la fuerza de respuesta desplazada a lo largo de la dimensin del estmulo en el sentido de ED y alejndose de E . O sea, al ir hacia la izquierda de la dimensin de estmulo, en la Figura 8 se observa que se eleva la curva para la fuerza neta de respuesta, alcanzando un pico no en el ED original sino en un punto situado a la izquierda de l. Dicho desplazamiento se obtiene despus del adiestramiento de discriminacin que incluye un reforzador diferencial a los estmulos ED y E . Implica: 1 entrenamiento con ED (ED- R- Ref), 2 entrenamiento con E (E - R- no Ref) y 3 vuelta a ED mayor R ante ED+n Citemos un ejemplo (Wittig, 1982, p. 125) sacado de la poltica: supongamos que un hombre apoya a una candidata que es ligeramente ms conservadora que el candidato que normalmente ha apoyado en otras ocasiones. Al salir elegida dicha candidata, los proyectos de ley por los cuales trabaja y vota a favor, son en extremo conservadores -hecho que sirve como una fuerte condicin para el votante-. En las siguientes elecciones, el hombre puede cambiar y no volver a su posicin original sino ir mucho ms all apoyando a un candidato a quien inicialmente hubiera juzgado muy liberal. Otro ejemplo de tipo deportivo: Un habitual seguidor del Real Madrid traslada sus simpatas al Atltico de Madrid. Tras el fracaso futbolstico de ste ltimo vuelve a simpatizar ms que nunca con el equipo blanco.
Gradiente en la prueba posterior al establecimiento de las propiedades del estmulo

Gradiente original

ED

Dimensin del estmulo Figura 8: Representacin grfica del fenmeno de desviacin del vrtice.

Debe notarse que el fenmeno de la desviacin del vrtice no se refiere a una intensificacin en la magnitud de la respuesta debido a la experiencia previa, lo cual nos remitira al fenmeno de contraste ya estudiado en el captulo anterior. En este caso, lo que se produce es una traslacin de la respuesta

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

251

en el espectro de los potenciales estmulos discriminativos, una radicalizacin de la respuesta original del sujeto en una direccin debido a una experiencia frustrante (no reforzada) cuando coyunturalmente el sujeto da respuesta ante otros estmulos situados en la direccin contraria del espectro. e) Discriminacin de relaciones: La transposicin La transposicin es la capacidad que tienen los organismos para llevar a cabo discriminacin de relaciones. El E de una prueba pasa a ser ED de la segunda. El experimento clsico consiste en presentar dos crculos, el mayor hace de ED y el menor de E . Khler (1925) utiliz pollos para que discriminaran entre dos superficies grises circulares (una ms grande que la otra), de tal modo que se aprenda a discriminar entre ellos (reforzando cuando se responda ante el crculo mayor). A continuacin, se presentaba el crculo menor junto con otro ms pequeo, haciendo reforzar al sujeto ante el mayor de ambos (que en la primera prueba era el E ), como vemos en la Figura 9. 1 Prueba ED E ED E 2 Prueba

Figura 9: Ejemplo de transposicin.

De este modo se aprende a responder a la relacin (en este caso "ser menor que") entre estmulos, prescindiendo de los valores absolutos de los mismos. En situaciones de la vida real, el fenmeno de transposicin se produce, por ejemplo, cuando el entrenador de un equipo de baloncesto coloca como pivot titular al jugador "ms alto" de la plantilla. El criterio de seleccin es por tanto comparativo y el jugador ms alto en un momento dado puede no serlo en la temporada siguiente.

5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO 5.1. Aplicacin de instigadores y desvanecimiento 5.1.1. Dificultades con el refuerzo diferencial
Sabemos pues que existe control de estmulo cuando en presencia de un estmulo antecedente particular hay mayor probabilidad de que ocurra una respuesta particular. Est claro que lo que se aprende en este caso no es una respuesta nueva sino a producirla en las condiciones apropiadas, en cuyo caso estas condiciones (estos estmulos antecedentes) provocan esa respuesta. Es decir, el estmulo antecedente es significativo para el sujeto y, a la manera del EC, activa en el aprendiz la expectativa de que determinada respuesta ser reforzada en su presencia. No son pues los estmulos los que contr olan al sujeto (a los estmulos no se le pueden atribuir funciones humanas) sino el sujeto quien controla pues la situacin en funcin del significado atribuido al estmulo antecedente. El control de estmulo generalmente se adquiere con procedimientos de refuerzo diferencial. Para que ste sea eficaz en el control de estmulos, deben darse una serie de condiciones ptimas:

252

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

- debe ocurrir la respuesta deseada, - los estmulos esenciales deben controlar alguna conducta de atencin del sujeto, - los dos sucesos (estmulo y atencin focalizada) deben ocurrir simultneamente para que se suministre el refuerzo. No obstante, hay veces en que no resulta efectivo. No es fcil que el estmulo controle (adquiera el significado pertinente para provocar...) la respuesta y ello puede ser debido, segn Sulzer-Azaroff y Mayer (1977), a varios factores: - porque la respuesta no se hallaba en el repertorio de respuestas del sujeto (por ejemplo, en el nio que no sabe leer, al ver la letra p (ED) no sabr pronunciarla), - porque la respuesta est bajo el control de otros estmulos o el estmulo controle otras respuestas (en nios pequeos se dan muchos ejemplos: responde pap al ver personas con gafas, al ver un peridico a mano le induce la respuesta de despedazarlo, al ver a su madre coger el bolso de paseo le motiva a levantarse e irse a la puerta para salir, etc.), - porque el estmulo sea difcil de percibir por problemas sensoriales o motores, - porque la respuesta haya tenido en el pasado un control de estmulo diferente (por ejemplo, con un nuevo procesador de textos, centrar un ttulo se hace combinando las teclas Ctrl y T, pero con el anterior procesador se haca con Alt + C). Por todo ello, es preciso utilizar mtodos adicionales, sobre todo instigadores y desvanecimiento posterior.

5.1.2. Los instigadores como facilitadores de la discriminacin


Cuando el refuerzo diferencial es insuficiente para conseguir el control de estmulo se utilizan instigadores o incitadores. Los instigadores son estmulos adicionales que se presentan conjuntamente con los estmulos que queremos que sean discriminativos. Se trata de estmulos inicialmente ms significativos (ya poseen un significado, una funcionalidad conductual) y que es til usarlos temporalmente para facilitar la emisin de respuesta cuando el control de estmulo no es completo. Las funciones del instigador en relacin con el estmulo que queremos que se convierta en discriminativo, se entienden bien al comparar esta situacin con lo que ocurra en el condicionamiento clsico: El instigador tendra una funcin similar al EI y el EC es el estmulo que queremos que adquiera fuerza sealizadora (que sea ED). Por eso, el procedimiento consiste en emparejar el estmulo nuevo con el instigador (igual que EC-EI). Obviamente, un instigador no necesariamente elicita respuestas reflejas; basta con que sea un EC excitatorio previamente condicionado a un EI o un estmulo discriminativo ya consolidado (por anterior entrenamiento ED-R-Eref). Se distinguen varios tipos de instigadores: a) Instigadores verbales. Se trata de las tpicas instrucciones verbales, o sea, decirle al sujeto lo que debe hacer. Por ejemplo, el maestro que quiere ensear a sus alumnos a escribir la letra "a" les dice nios, escribid la letra a b) Demostracin. Es el conocido aprendizaje observacional utilizando modelos (modelado): Alguien realiza ante el sujeto la conducta que ste debe aprender. Se trata por tanto de un procedimiento de imitacin. En el ejemplo anterior, el maestro escribe la letra a. Si combinase instrucciones verbales y demostracin, el maestro dira escribir la letra a, tal y como lo hago yo. Cuando fallan las instrucciones verbales se utiliza este mtodo.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

253

c) Gua fsica. Consiste en guiar el movimiento correcto de la respuesta y se utiliza cuando fallan los anteriores. En el ejemplo citado, el maestro cogera la mano del nio y se la movera para escribir la letra "a". Estos tres instigadores se pueden ordenar en una escala de mayor a menor intrusividad, es decir, en cuanto al menor o mayor grado de importancia del instigador o probabilidad de que sea seguido por el aprendiz. El ms intrusivo es la gua fsica, le sigue la demostracin y por ltimo las instrucciones verbales. d) Otros tipos de instigadores. Otros instigadores muy usados en la prctica son los perceptivos, por ejemplo, para lectura o escritura, magnificacin de los rasgos crticos de estmulo, el punteado de las letras en los cuadernos de caligrafa, etc. En la enseanza o en procedimientos de adiestramiento, se suele comenzar por los instigadores menos intrusivos. Por ejemplo, en una tabla de gimnasia, el monitor da las explicaciones pertinentes sobre los movimientos que han de hacer los alumnos. Si estos instigadores no son vlidos para que se logre el control de estmulos, entonces habr que recurrir al siguiente: la demostracin (el monitor realiza el movimiento o el ejercicio tal y como lo deben hacer sus alumnos). Si tampoco funciona entonces habr que recurrir a la gua fsica (el monitor coge el brazo o la pierna del sujeto y se la mueve en la direccin correcta). Normalmente se suelen combinar los instigadores (instruccin verbal con demostracin, etc.). En cualquier caso, es importante que los instigadores se vayan retirando mediante desvanecimiento, tal y como se explica en el siguiente apartado.

5.1.3. Desvanecimiento de los instigadores


Si no se retirasen los instigadores nunca se establecera un adecuado control de estmulo, es decir, difcilmente el sujeto sabra emitir la respuesta en presencia slo del ED y siempre requerir el instigador. Por ejemplo, si siempre que el nio escriba le vamos a guiar la mano cmo aprender a realizar los movimientos precisos que corresponden a la escritura?. De igual manera, no sera correcto que el sujeto slo hiciera las cosas cuando se le dan las instrucciones verbales para ello (escribir cuando se le diga que escriba, etc.); si as fuera, tendramos sujetos pasivos, con muy escasa autonoma e iniciativa propia. As pues, hay que desvanecer progresivamente los instigadores de modo que si se utiliza un instigador muy intrusivo, ste debe ir sustituyndose por otro menos intrusivo y as sucesivamente hasta que desaparezcan totalmente los instigadores. Adems, hay que usarlos el mnimo tiempo posible.

5.1.4. Mtodos aplicados a la reeducacin de las dificultades de aprendizaje


La aportacin del enfoque de condicionamiento para la adquisicin del control de estmulos puede ser til para el enseante o reeducador. Un sector al que se aplican con gran xito es al de los nios discapacitados en algn rea concreta del aprendizaje: retrasos o deficiencia intelectual, lenguaje, lecto-escritura y aritmtica (Hallahan y Kauffman, 1976; Worell y Nelson, 1982, Valls, 1986). Los mtodos ms usuales son los basados en el control de estmulo mediante el uso de instigadores y desvanecimiento, aunque por supuesto tambin se utilizan procedimientos de refuerzo. La estrategia principal es la de las intervenciones multimodales, donde los procedimientos operantes sean una parte o componente ms de los mismos.

254

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

5.2. Cambio de un control de estmulo por otro: El cambio fsico de ambiente


En ocasiones un aprendizaje instrumental sealizado puede ser problemtico, es decir, la exposicin a determinados estmulos discriminativos puede provocar respuestas no deseadas. La televisin provoca la respuesta de entretenerse con ella e impedir que hagamos otras cosas ms necesarias (por ejemplo, estudiar un examen); el contexto habitual en el que comemos mucho puede ser perjudicial si queremos adelgazar puesto que esos estmulos "controlan" esa conducta. Una tcnica aplicada en modificacin de conducta para lograr cambiar un control de estmulo no deseado es el cambio estimular: si queremos cambiar algn tipo de conducta o hacer que una conducta deseable (pero difcil de conseguir) sea ms frecuente, conviene rodearse de otro contexto estimular y disponer otros estmulos discriminativos para la nueva conducta objetivo. As, para la deseable conducta de estudiar, Domjan y Burkhard (1986; p. 319 trad. cast.) proponen los siguientes nuevos estmulos discriminativos:
"1. Seleccionar un lugar adecuado para estudiar, con iluminacin adecuada y libre de distracciones. 2. Estudiar en ese lugar y slo en ese lugar (no estudiar en la cama pues esto lleva probablemente a dormir antes que a estudiar). 3. Permanecer en el rea de estudio slo durante el tiempo que estamos estudiando. Si nos empezamos a distraer, nos tenemos que disponer a abandonar el rea de estudio. 4. Antes de abandonar de hecho el rea, completar una pequea unidad de trabajo. Terminar de leer la pgina o completar un problema".

Se trata pues de convertir el rea de estudio en el nuevo estmulo discriminativo de la conducta de estudiar. En esta misma lnea, puede interesar que la respuesta no est controlada por muchos estmulos sino por uno en particular. El obeso que come mientras ve la televisin o escucha la radio, o habla con otros, etc. debera comer exclusivamente en la mesa del comedor, a ciertas horas, sin televisin ni radio, etc. En definitiva, estos planteamientos permitiran al sujeto un mayor autocontrol y no tanta dependencia de los estmulos y de personas o servicios que proporcionen instigadores.

6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO 6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin aversiva 6.1.1. Tipos de aversividad
El condicionamiento, sea clsico o instrumental, se realiza muchas veces con estmulos aversivos. Un estmulo aversivo es lo que en lenguaje cotidiano llamamos estmulo "molesto", "incmodo", "doloroso", "desagradable", "nocivo", etc., es decir, su aplicacin al sujeto tiene para l consecuencias negativas. La aversividad es pues cualquier evento que produzca una percepcin de malestar o desagrado. Proponemos cinco criterios para clasificar o caracterizar los eventos aversivos: 1) Criterio estimulacin aversiva primaria secundaria: Una cosa es la estimulacin que produce dolor o malestar fsicos directos y otra las seales o EC o ED previamente asociados a estimulacin aversiva primaria (enchufes, fuego en la cocina, dedos puestos en el quicio de la puerta, nube oscura que amenaza lluvia, etc.).

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

255

2) Criterio estimulacin aversiva directa indirecta: Una cosa es la aplicacin directa de estimulacin aversiva primaria que produzca dolor o malestar fsico (descarga elctrica en el animal, agresin, tortura, malos tratos fsicos, hambre, sed, enfermedad, problema irresoluble, etc.) y otra es la ausencia del refuerzo esperado. 3) Criterio contingencia o dependencia estimulacin aversiva respuesta: Se trata de la contigidad o proximidad espacio temporal de una con respecto a la otra, en contraposicin a una relacin contingente o no necesaria, es decir, sin aparente relacin entre un evento y otro. En este caso de la no dependencia, tenemos la situacin de indefensin aprendida 4) Criterio orden temporal de ocurrencia entre estimulacin aversiva respuesta. Esto ocurre sobre todo cuando dependencia entre estimulacin aversiva y respuesta, y tenemos dos claras opciones: - Eav R (primero estimulacin aversiva y despus la respuesta): Si primero se aplica estimulacin aversiva y su cese es contingente con (dependiente de) la aparicin de una respuesta, entonces aumentar la probabilidad de ocurrencia de dicha respuesta. Segn sto, y siguiendo la tradicin skinneriana, esta situacin conlleva refuerzo negativo (refuerza el cese -contingente a la respuesta- de la estimulacin aversiva, lo cual fortalece y mantiene la respuesta) y es tpico paradigma de escape. Estas condiciones de refuerzo negativo las podramos simbolizar del siguiente modo: Eav - R No Eav (Ref. neg.) - R Eav (primero respuesta y despus estimulacin aversiva): Si primeramente aparece la respuesta y tras ella se aplica contingentemente estimulacin aversiva, entonces disminuir la probabilidad de ocurrencia o incluso se eliminar la respuesta. Esta acepcin sigue la tradicin de Thorndike y ms tarde se denomin, para distinguirlo del anterior, estimulacin punitiva y se inserta en el paradigma de castigo. Se simbolizara: R Eav 5) Criterio efectos en la respuesta: En psicologa del aprendizaje, un estmulo aversivo se define en funcin del efecto que produce en la conducta. En general, hay tres efectos en la conducta relacionada con dicha estimulacin: - Incremento de la tasa de respuesta por refuerzo negativo. Suele ocurrir en situaciones Eav - R y por tanto en casos de escape y evitacin - Disminucin de la tasa de respuesta por estimulacin punitiva contingente. Se trata de situaciones R - Eav y es el caso del castigo. - Aparicin de alteraciones conductuales, emocionales o conductuales, ligadas a la aplicacin de estimulacin punitiva contingente y sobre todo no contingente. El efecto de esta modalidad se conoce desde Seligman (a mediados de los 60) como indefensin o impotencia aprendida (difcil traduccin del ingls learned helplessness), en la cual el sujeto recibe estimulacin aversiva inescapable. Sera una situacin del tipo: R - Eav no conting.

6.1.2. Tipos de condicionamiento con estimulacin aversiva


Como ya se dijo en el Tema 4, los paradigmas o tareas experimentales en los que se ha usado estimulacin aversiva, al menos en el condicionamiento instrumental, son esencialmente cuatro: escape, evitacin, castigo e indefensin aprendida. En los dos primeros se ha utilizado estimulacin aversiva en su acepcin de refuerzo negativo; en el tercero se trata ms bien de estimulacin punitiva; en el

256

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

cuarto la estimulacin punitiva no es contingente a la respuesta. Los tres primeros pueden incluir diversas variantes, sobre todo si se utilizan estmulos discriminativos. En cuanto a la indefensin aprendida, algunos manuales de aprendizaje lo citaban como una variedad del castigo (Pelechano, 1980), aunque desde hace tiempo (Wittig, 1982; Hulse et al., 1982) lo consideran como otro paradigma ms de aprendizaje con estimulacin aversiva. Algunos han tratado tambin la aversividad resultante de suprimir o disminuir un reforzador. En estos casos se habla del castigo por supresin, extincin simple y entrenamiento de omisin. Aunque estos dos ltimos tipos no los trataremos aqu, los esquemas de las Tablas 1 (adaptada de la expuesta en el Tema 4) y 2 nos resumen todo esto.
Tabla 1: Tipos de condicionamiento con estimulacin aversiva en funcin de los tipos de consecuencias sobre la conducta y del tipo de relacin R-C. CONSECUENCIAS / resultados POSITIVAS N E G A T I V A S (aversivas) adquIsIcIn extIncIn Por cese de Por aplicacin Por omisin del estimulacin aversiva Reforzador (ref. negativo) - Escape - Castigo por - Castigo por - Evitacin aplicacin supresin (cast. positivo) (cast. negativo) - Indefensin aprendida

SI Relacin de contingencia R - C

NO

Tabla 2: Presencia de los criterios de clasificacin de los eventos aversivos en los tipos de condicionamiento con estimulacin aversiva (Eav). Escape Evitacin Castigo por Castigo por Extincin Indefensin Criterios aplicacin supresin aprendida Eav. Primaria Si Si Si Eav. Secundaria Si Si Eav. directa Si Si Si Si Eav. indirecta Si Si Eav. contingente Si Si Si Si Si Eav. no contingente Si Orden temp. Eav.-R Si Si Orden temp. R-Eav. Si Si Incremento de R Si Si Disminucin de R Si Si Si Si Alteraciones de R Si Si

6.2. Condicionamiento de escape 6.2.1. Definicin


En el procedimiento de escape, ante la aparicin de estimulacin aversiva, el organismo emite una respuesta que logra el cese de dicha estimulacin. O sea, la respuesta del organismo hace que cese el estmulo aversivo. Por tanto, dicho cese es contingente o dependiente de la realizacin de la respuesta y con ello, tras repetidas presentaciones de estimulacin aversiva, se logra usualmente un aumento de frecuencia de la respuesta. El cese del estmulo aversivo (gracias a la respuesta) es el evento crucial que se convierte en un reforzador negativo. La representacin simblica del procedimiento de escape es la siguiente: Eav - R No Eav

Ms en detalle, supondra una secuencia con dos fases seguidas: 1) Una R1 provoca la Eav y la consecuencia 1 de dao o dolor 2) Una R2 de escape provoca una consecuencia 2 de cese de Eav y alivio

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

257

En el futuro, el sujeto aprende a no hacer R1. Es un tipo de aprendizaje que se logra con rapidez y es muy adaptativo. Todos escapamos de circunstancias aversivas y procuramos que esa experiencia desagradable no nos vuelva a ocurrir: un nio aprende a no tocar una estufa encendida si alguna vez se quem con ella, o sea R1 (tocar estufa encendida) Eav (calor fuerte) Consecuencia 1 (de dao o dolor) R2 escape (retirar mano) Consecuencia 2 de cese Eav (alivio). Ms ejemplos: una persona que se encuentra en un ambiente donde hay excesivos ruidos presenta comportamiento de escape simplemente alejndose del lugar donde se emite el ruido; si empieza a llover y te mojas rpidamente abres el paraguas (y si no lo tienes te resguardas en un portal), con lo cual cesa la estimulacin aversiva, la respuesta tiene una consecuencia positiva y se refuerza para el futuro. Los procedimientos y tcnicas experimentales ms utilizados en la investigacin de la conducta de escape aparecen resumidos en el Cuadro 1.

6.2.2. Condiciones o factores en la adquisicin de la conducta de escape


Citaremos slo dos de los ms importantes: 1) Intensidad del estmulo aversivo: Cuanto ms fuerte sea la estimulacin aversiva mejor se aprende la conducta de escape. Esto se relaciona directamente con la magnitud del reforzador: como aqu es un refuerzo negativo, lo importante es la disminucin relativa de intensidad del estmulo aversivo tras la respuesta. 2) Retraso en la eliminacin del estmulo aversivo: Cuando se elimina el estmulo aversivo poco despus de que el sujeto emita la respuesta, esta demora en la aparicin del refuerzo negativo produce una disminucin en el rendimiento de los sujetos en la conducta de escape.
Cuadro 1: Procedimientos experimentales de adquisicin de la conducta de escape. En animales Aparatos Un primer procedimiento con animales fue el utilizado por Muenzinger y Fletcher en 1936. Se trata de un laberinto en forma de T con el suelo electrificable. Se coloca al animal (normalmente ratas) en la base de la T y se le dan shocks hasta que gire por el brazo deseado (izquierdo o derecho). En cada ensayo se mide o bien el tiempo que tarda o el nmero de elecciones incorrectas de brazo. Despus de 100 ensayos se consigue un ptimo entrenamiento de escape con este procedimiento. Posteriores estudios llevaron a otros procedimientos usando aparatos en los que pueden presentarse series largas de ensayos (presentaciones de Eav) en intervalos apropiados sin que se tenga que sustituir al sujeto. Dos han sido los ms usuales: - La caja de Skinner con suelo electrificado, de forma que la presin de la barra (R) haga que cesen los shocks elctricos. - El aparato ms usado para el estudio del condicionamiento de escape es la caja de saltos o lanzadera (shuttle box), que ya se encuentra en los experimentos clsicos de Mowrer (1938, 1939). Dicha caja (como se puede apreciar en la Figura 10a, o en una versin actual en la Figura 10b) es una cmara con dos compartimentos donde la respuesta operante que se mide es el movimiento desde un compartimiento a otro (usualmente el movimiento en cualquiera de las dos direcciones cuenta como una respuesta). Una variante ms actual es una sola cmara con la rejilla basculante: cuando el animal est en un lado, la rejilla toca el suelo y cierra el circuito elctrico para administrar la descarga, que cesar cuando salte al otro lado. Este aparato tambin se utiliza en el aprendizaje de evitacin. Estmulos El estmulo aversivo es usualmente shock elctrico aplicado a travs de la parrilla de alambre del suelo. La conducta de escape se adquiere rpidamente en dicho aparato, posiblemente porque la respuesta operante requerida (saltar) est relacionada directamente con la conducta incondicionada elicitada por el shock. Tipos de medida La medida del escape suele ser, segn Fernndez Castro (1989), o bien latencia (tiempo desde el inicio del estmulo aversivo al inicio de la respuesta) o magnitud de respuesta (velocidad de carrera o presin de palanca en caja de Skinner).

En humanos

258

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

Con humanos la respuesta elegida suele ser de tipo manipulativo (a menudo enmascarada la tarea con problemas de discriminacin) y como estimulacin aversiva, adems de la descarga elctrica de baja intensidad, se utilizan ruidos fuertes y molestos o incluso alguna tcnica similar a las del castigo por supresin de reforzador (vase el apartado correspondiente de este captulo).

Figura 10: Lanzadera o caja de saltos, en versin antigua (a) o actual (b)

6.3. Aprendizaje de evitacin 6.3.1. Definicin, fases en la adquisicin, tipos y procedimientos


La evitacin es uno de los fenmenos ms estudiados en el condicionamiento con estimulacin aversiva. Una conducta se llama de evitacin cuando impide la confrontacin del sujeto con un acontecimiento que tiene caractersticas aversivas. Es decir, el efectuar una respuesta pospone o elimina la estimulacin aversiva. De otro modo podemos decir que ocurrir un Eav a no ser que aparezca la respuesta. Se producir el aprendizaje de evitacin si dicha contingencia lleva a un aumento de la frecuencia de respuesta, con lo cual el cese del estmulo tiene propiedades de reforzador negativo para la respuesta. Los primeros estudios sobre evitacin provienen, segn Domjan y Burkhard (1986), de Bechterev (1913) dentro del condicionamiento pavloviano. Su experimento se realiz con humanos y consista en pedirles que introdujeran un dedo (R instrumental) en un recipiente de metal. Al hacerlo se haca sonar

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

259

un zumbido de aviso (EC) y al estar el agua electrificada sufran una descarga elctrica (EI). Lgicamente la retirada del dedo (R de evitacin) era inmediata y en sucesivos ensayos el inicio del EC permita no sufrir EI. Parece condicionamiento clsico pero no lo es puesto que en aqul el EI ocurre independientemente de la respuesta mientras que aqu la respuesta instrumental impide su aparicin. La diferencia entre escape y evitacin estara en que en sta ltima la respuesta pospone o elimina una estimulacin aversiva que todava no ha ocurrido. En la conducta de escape siempre se aplica estimulacin aversiva al sujeto mientras que en la evitacin basta con la presentacin de un E D (EC en trminos de condicionamiento clsico) que de alguna manera evoque (por asociacin previa EC-EI aversivo) la estimulacin aversiva. Adems, en la situacin de escape, la supresin de estimulacin aversiva ocurre tan pronto como se emite la respuesta, mientras que en la evitacin se previene la aplicacin de estimulacin aversiva mediante la respuesta. As, por ejemplo: - un baista se aplicar bronceador (R) para evitar quemaduras en la piel (Eav) por el sol al llegar a la playa (ED); - los conductores obedecen las seales de trfico para evitar accidentes o multas; - ED (da nuboso): R (llevar sombrilla) No Eav (evitacin de la lluvia). O sea, no es necesario que nos mojemos por la lluvia al salir de casa (Eav) para que cojamos la sombrilla (R); basta con que veamos el da muy nuboso (ED). As pues, en la evitacin tenemos seales del entorno que por aprendizaje previo son aversivas; se podra decir, por tanto, que la evitacin es una conducta motivada por el miedo (Gray, 1988; trad. cast. 1993, p. 132). El sujeto aprende a darle un significado atemorizante a determinadas seales del entorno. Podemos decir que en el paradigma de evitacin, el sujeto "escapa" o reacciona no ante la presencia de la estimulacin aversiva en s, sino ante los estmulos discriminativos (EC) que sealizan la posterior presencia de estimulacin aversiva (EI), y por tanto el miedo (RC) provocado por esos estmulos sealizadores es la emocin que motiva la conducta de evitacin. Al emitir esa conducta, el miedo se reducir, lo cual supone un refuerzo negativo para esa conducta de evitacin. Hay que notar que el miedo tiene un doble valor aqu: es una respuesta del sujeto condicionada a una determinada situacin estimular, pero tambin es en s un estmulo aversivo del que el sujeto hace por escapar (con lo cual evita el estmulo posterior que el miedo anticipa). Aunque se explica ms adelante en la teora bifactorial de Mowrer, parece evidente que el establecimiento de la conducta de evitacin necesita dos fases: - Una fase previa, en la que un determinado estmulo adquiere un significado aversivo de algo que antes no tena. Puede ser un escape sealizado, esto es, tener la experiencia del par ED- Eav, o, si se quiere en la terminologa del condicionamiento clsico, la experiencia EC-EIav; o puede ser una respuesta castigada (R- Eav). Si es el primer caso, tendremos la evitacin activa (hago algo tras la seal para evitar Eav) y si es el segundo, la evitacin pasiva (no vuelvo a hacer R para evitar Eav), como analizaremos enseguida. En cualquier caso, es caracterstico de la evitacin que se adquiere con muy pocos ensayos de este tipo, incluso basta con un aprendizaje vicario u observacional. - La fase propiamente de evitacin, en la que el evento (estmulo o respuesta) con significado aversivo, por s solo y sin necesidad de que aparezca la estimulacin aversiva, produce la respuesta de evitacin. Se han descrito (Gray, 1988; Klein, 1991) dos tipos de aprendizaje de evitacin: la evitacin activa y la pasiva. a) Evitacin activa

260

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

Se trata de realizar una conducta que, ante la correspondiente seal atemorizante, impida o prevenga la estimulacin aversiva. Abrir el paraguas ante seales de lluvia, el nio que hace los deberes para no suspender el examen, pagar el alquiler para evitar que nos echen del piso, caminar por la acera para que no me atropellen los coches, etc. El sujeto aprende pues un comportamiento nuevo: realizar una determinada accin para no tener una experiencia desagradable. Una descripcin muy interesante es la de Gray (1988; trad. cast 1993, p. 134) poniendo ejemplos de animales: El animal quiere que se le deje en paz (...) pero alguien (el domador de circo, el psic logo experimental) desea que adquiera alguna nueva forma de conducta. El domador somete al animal al estmulo temido y retira ese estmulo slo si el animal realiza la conducta deseada. En otras palabras, es castigado por hacer cualquier otra cosa que no sea la respuesta deseada. Es como si le advirtiera al animal: Haz esto, o si no.... En trminos coloquiales, la evitacin activa sera saber lo que hay que hacer para no sufrir algo malo. b) Evitacin pasiva Aqu la conducta impide exponerse a un acontecimiento aversivo. Un ejemplo de Klein (1991; trad. cast. 1994, p. 211) es muy ilustrativo: Imagnate que recibes una carta del dentista recordndote que debes realizar un chequeo semestral (...); no respondiendo a la carta, evitas al dentista. Es decir, se abandona un tipo determinado de actividad porque tenemos experiencia de que va seguida de una consecuencia desagradable. Siguiendo con ejemplos de animales, Gray (op. cit.) dice que, en la evitacin pasiva, el animal quiere hacer algo y esta accin le conduce a ponerse en contacto con el estmulo atemorizante. La nica forma de evitar el estmulo temido es abandonar la conducta deseada. Por ejemplo, un animal hambriento busca comida, pero si toca la comida puede que se le aplique una descarga elctrica. Hay pues dos fases: - Fase previa: Tras ED se produce la respuesta y entonces recibe estimulacin aversiva (es pues una experiencia previa de castigo) - Fase actual: Al aparecer ED entonces el sujeto no produce la respuesta Como dice Gray, es como si se advirtiera al animal: No hagas eso, o si no.... Tambin en trminos coloquiales, la evitacin pasiva consistira en saber lo que hay que dejar de hacer para no sufrir algo malo (aunque me guste). La evitacin pasiva es pues la consecuencia posterior de una conducta previamente castigada. Una respuesta que es castigada, en el futuro ser evitada aprovechando las seales externas (ED ) o internas (recuerdo de la experiencia) que conducen a ella. Sera una secuencia que esquemticamente se podra expresar: (ED ) Expectativa de R-Eav No realizacin de R

El mismo autor sugiere que la evitacin pasiva en realidad es un conflicto de aproximacin - evitacin. En efecto, el sujeto est solicitado, mediante seales procedentes del medio, por dos formas de conducta incompatibles entre s: - aproximarse a un objeto o estmulo deseado, interesante o apetecible - mantenerse alejado de l (pues hay experiencia previa de que produce algo aversivo) Volviendo al ejemplo del dentista: Quiero ir al dentista para solucionar los problemas que tengo con mi dentadura (aproximacin) pero no voy a ir pues me da miedo, hace dao, etc. (evitacin). Dos tipos de procedimientos experimentales muy utilizados, al menos en la evitacin activa han sido: la evitacin discriminativa de ensayos discretos y la tcnica de evitacin de Sidman o de operante libre. El Cuadro 2 describe detalladamente estas tcnicas

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

261

6.3.2. Condiciones para la adquisicin de la respuesta de evitacin


1) Intensidad de estimulacin aversiva: Generalmente a mayor intensidad corresponde un mayor rendimiento en la respuesta de evitacin. 2) Intensidad y duracin de ED: Cuanto ms intensa sea la seal que precede a la estimulacin aversiva mayor rendimiento se dar en la respuesta de evitacin. 3) Intervalo ED-Eav (en trminos pavlovianos, EC-EI, intervalo entre estmulos, IEES): Perodos de tiempo ms largos, por lo general producen mejores niveles de ejecucin, y si adems se vara el intervalo ED-Eav alrededor de algn valor promedio (en vez de mantenerlo fijo a lo largo de los ensayos), entonces produce an mejor rendimiento (tal vez porque las variaciones en la ejecucin producen mayor atencin por parte del sujeto). 4) Intervalo entre ensayos (IEEN): La ejecucin vara segn una curva en forma de U invertida con mejores respuestas a medida que se incrementa el intervalo hasta cierto punto, disminuyendo despus al incrementarse ms an el valor del IEEN.
Cuadro 2: Procedimientos experimentales para la adquisicin de la conducta de evitacin

1) Evitacin discriminativa de ensayos discretos En este tipo hay un ED por el cual la ejecucin de la respuesta pospone o evita la estimulacin aversiva. En el laboratorio se us por primera vez en un experimento de Brogden, Lipman y Culler en 1938, en el cual una seal discriminativa (ED) precede a cada shock. Despus, la respuesta durante el aviso ED impide la aplicacin de la descarga. Las respuestas durante el intervalo entre ensayos no tienen efecto. Cada shock ser evitado si una respuesta ocurre durante cada E D (el cual desaparece tambin al emitirse la respuesta). La Figura 11 nos muestra un diagrama de dicho procedimiento.

R
ED ED ED ED ED

ED

Shock
Figura 11: Diagrama del procedimiento de evitacin discriminativa.

En general, con la evitacin discriminativa se ha seguido el procedimiento experimental de ensayos discretos o separados: un ensayo comienza siempre con la aparicin de ED y termina con la emisin de la respuesta. Normalmente con animales (perros, ratas) se usa la caja de saltos. El experimentador puede exigir al animal que salte alternativamente de un compartimiento a otro para evitar el shock (procedimiento llamado "evitacin de doble direccin" o de vaivn) o bien puede exigir simplemente un salto en una direccin y, una vez ejecutado el salto, sacar al animal del segundo compartimiento para volver a colocarlo en el primero al comienzo del ensayo siguiente ("evitacin en una direccin"). 2) Evitacin tipo Sidman o de "operante libre". Este tipo de evitacin la inici experimentalmente Sidman en 1953 con el procedimiento que lleva su nombre. En este caso, la estimulacin aversiva se aplica a intervalos regulares (segn un programa IF) a no ser que ocurra la respuesta, con lo cual se pospone dicha estimulacin aversiva durante cierto intervalo de tiempo (tambin fijo). Si la siguiente respuesta ocurre antes de que finalice dicho intervalo R-Eav, se vuelve a posponer el Eav, y as sucesivamente es como evitar la estimulacin aversiva. En este procedimiento, la seal discriminativa es el intervalo fijo, la pauta regular de aparicin de la estimulacin aversiva.

262

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

5) Respuestas de defensa especficas de especie: Se hicieron experimentos donde se variaba el tipo de respuestas que deba dar el animal para evitar la estimulacin nociva, y se encontr que las respuestas de evitacin exigidas deban ser compatibles con el tipo de estimulacin y acordes con las respuestas naturales en la especie animal que aprende, pues de otra manera no eran aprendidas. Bolles y otros (Bolles, 1969; D'Amato y Schiff, 1964; Meyer, Cho y Weseman, 1960) fueron los autores de este tipo de experimentos y llegaron a esta misma conclusin: no todas las respuestas son igualmente condicionables. Las ratas, en una situacin aversiva aprendan bien una respuesta de salto o de carrera, pero no una conducta esttica (por ejemplo, permanecer sentadas sobre las patas traseras). Para explicar este fenmeno contrario a las leyes tradicionales del aprendizaje (vase la ley de equipotencialidad, en el Captulo 1), Bolles acu el trmino de reaccin de defensa especfica de especie (RDEE), segn la cual, un animal aprende una respuesta de evitacin slo si dicha respuesta es parte de las reacciones defensivas naturales innatas de dicho animal. El concepto de preparacin (preparedness), acuado por Seligman (1970), viene a incidir en el mismo tema. Con ello se quiere indicar que un animal puede estar preparado, no preparado o contrapreparado para aprender determinadas respuestas. La contrapreparacin se manifiesta cuando el organismo muestra una resistencia extrema a aprender algo (la conducta esttica de las ratas, antes mencionada). Se trata de un concepto operativo que se puede medir a travs del nmero de ensayos que se necesitan para lograr que esa respuesta sea aprendida. 6) Adquisicin de respuestas de evitacin mediante acoplamiento con otras y/o con refuerzos : Sobre todo en el mbito de la interaccin social humana, es muy frecuente encontrar situaciones en las cuales determinadas conductas de evitacin de unos sujetos se potencian por las conductas de evitacin de otros. Por ejemplo pensemos en una interaccin entre dos sujetos, A y B, que sigue el siguiente esquema: Sujeto A: Sujeto B: E av. R Eav. E ref. neg. R ev.
Con la prctica, R ser R ev.

Un ejemplo tpico se da en la interaccin entre nios y padres: Lo que para un sujeto A (beb) no es ms que emitir una conducta de llanto por un estmulo aversivo interno suyo (tiene molestias digestivas, etc.), para un sujeto B (padre o madre) esa respuesta a su vez es un estmulo aversivo que provoca en l: (1) una actividad mental encubierta de formacin de hiptesis, atribuciones, etc. (por qu ll ora?: porque no ha dormido, porque tiene hambre, etc.), y (2) una conducta manifiesta de evit acin (alejarse del nio, llamar a la madre, mecer la cuna, etc.) que hace de refuerzo negativo para el sujeto B si cesa de llorar y as consolidarse su recuerdo procedimental y/o declarativo (para que no llore ya s que tengo que mecerlo). A su vez, para el nio, su conducta de llanto por estimulacin aversiva i nterna cesa cuando otros le solucionan el problema, con lo cual se refuerza el llanto como futura conducta de evitacin ante esa molestia. Ms ejemplos se pueden encontrar en Steiner (1988).

6.3.3. Por qu ocurre la evitacin (teoras explicativas)


Hay varios problemas difciles de resolver a la hora de explicar la evitacin: Cmo es posible que la no ocurrencia de un estmulo pueda ejercer un efecto fortalecedor para la conducta? qu acontecimiento en la situacin de evitacin podra responsabilizarse de la adquisicin de la conducta?. Son varias las teoras que se han propuesto para explicar la evitacin (Fernndez Castro, 1979). Pelechano (1980) cita hasta cuatro de ellas y en general se caracterizan porque: - postulan o hacen referencia a procesos mediacionales (tales como el miedo), - admiten la intervencin de dos procesos de aprendizaje: condicionamiento clsico e instrumental. De ah que muchas de ellas se llamen teoras bifactoriales o biproceso.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

263

Tudela (1981), coincidiendo en cierto modo con Tarpy (1975) y a Tarpy y Mayer (1978), agrupa estas teoras en dos tendencias: - la de los tericos del reforzamiento (que acentuaron la importancia de la motivacin interna del organismo), - la de los skinnerianos (que se fijaron ms en el papel de la estimulacin externa). La primera se referir a la teora bifactorial clsica de Mowrer, reformulada despus por Miller, Kamin, Solomon, Wynne, etc. La segunda se centra en la revisin de Schoenfeld, con su modelo de refuerzo sin motivacin. La misma teora bifactorial ha experimentado reformulaciones recientes de tipo cognitivo. Veamos pues, estos dos tipos de teoras en tres apartados: la teora bifactorial en su formulacin clsica, la teora del refuerzo sin motivacin y la actual reformulacin cognitiva de la teora bifactorial. a) Teora bifactorial de Mowrer Segn Mowrer (1947) -con reelaboraciones posteriores de Miller (1951, 1959) y del propio Mowrer (1960)- el hecho cuya ocurrencia activa la respuesta de evitacin es el miedo, el cual acta como un impulso (drive) que proporciona energa a la respuesta de evitacin y refuerzo negativo al cesar con ella mediante su reduccin. Pero el miedo al ED en este caso no es un impulso primario sino adquirido por condicionamiento clsico. El miedo es por tanto una RC al ED (que acta como EC) que se adquiere por el apareamiento previo de ED con el EI aversivo. Hay pues dos fases:
I) II) ED (= EC) ED

Eav (=EI)
RC (miedo)

RI (miedo) R instr. cese ED (ref. neg.)

Durante los primeros ensayos en que la respuesta de evitacin todava no ha sido aprendida, el apareamiento ED-Eav produce el condicionamiento de miedo al ED. De este modo el condicionamiento clsico del ED proporciona un significado de motivacin y emotividad aversiva a estmulos inicialmente neutros (Gray, 1988; trad. cast. 1993, p. 196). Despus, en la segunda fase, la sola presencia del ED provoca el miedo, lo cual activa la respuesta instrumental. La ejecucin de la respuesta hace cesar el ED (ste cese contingente sera un factor crtico), con lo cual desaparece o disminuye el miedo y se refuerza la respuesta. La respuesta instrumental se aprende no por evitar la estimulacin aversiva sino por escapar al miedo al cesar el ED con dicha respuesta Ha sido una teora muy estudiada y con gran soporte y evidencia experimental. Incluso ha sido mejorada con los aos. Por ejemplo, hoy da se considera (Gray, 1988; trad. cast. 1993, p. 208) que el comportamiento de evitacin es reforzado no slo por la reduccin del miedo al cesar E D, sino tambin por la aparicin, tras la respuesta, de seales de seguridad, que son estmulos presentes tras la respuesta de evitacin, por ejemplo en animales en la caja de saltos, el feedback cinestsico o propioceptivo tras el salto, la llegada al otro lado, etc. Son reforzadores secundarios pues aparecen siempre conjuntamente con el refuerzo negativo (cese de la seal condicionada aversiva). Esta teora ha sido aplicada en el contexto clnico a la explicacin de ciertas neurosis, particularmente fobias. As, no hay ms que entender la respuesta instrumental de evitacin como la conducta neurtica, la cual es mantenida porque con ella cesa el miedo o la ansiedad que se ha condicionado fuertemente al ED. b) Teora de refuerzo sin motivacin de Schoenfeld

264

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

Segn Schoenfeld (1950), el miedo es un proceso mediacional inobservable (y por tanto inestudiable desde una ptica conductista). El cese del estmulo aversivo con la respuesta acta como refuerzo negativo aumentando la probabilidad de la respuesta que lo suprime. En virtud de su frecuente asociacin con el estmulo aversivo, el ED se convierte en estmulo aversivo condicionado, adquiriendo as las caractersticas aversivas del shock. El sujeto escapa del ED (sin embargo, en la teora de Mowrer el sujeto escapa del miedo suscitado por el ED). Tambin se trata de una teora bifactorial pues el ED es refuerzo condicionado por condicionamiento clsico y la respuesta de evitacin es instrumentalmente reforzada por la terminacin del ED. En realidad, ambas teoras reducen la situacin de evitacin a un problema de escape. Segn Mowrer, el sujeto escapa del miedo, o del ED segn Schoenfeld. En ambos casos, el acontecimiento reforzador observable es el cese del ED. c) Reformulacin cognitivo-social de la teora bifactorial Desde la teora de las expectativas de auto-eficacia de Bandura (1977, 1986), se ha replanteado recientemente la teora bifactorial, al menos en su aplicacin a humanos (Villamarn, 1990). Segn esta teora, tanto la activacin de RC autonmica de miedo como la emisin de respuestas de evitacin dependen no slo de la activacin de expectativas adversas (el EC seala un prximo acontecimiento aversivo) sino sobre todo de la "competencia percibida" de tener capacidad para hacer frente a esa posible adversidad. Si el individuo percibe que dispone de conductas de afrontamiento y genera as expectativas de auto-eficacia, entonces habr menor miedo o ansiedad. Por tanto, lo que produce el miedo y la ansiedad no es el proceso de condicionamiento clsico previo sino las cogniciones o expectativas de resultados y las expectativas acerca de la propia eficacia para afrontarlos.

6.3.4. Extincin de la respuesta de evitacin


En este apartado analizaremos slo la extincin de conductas adquiridas por procedimientos de refuerzo negativo (estimulacin aversiva, previa a la conducta, que cesa al producirse sta), o sea, la extincin de conductas de escape y de evitacin. El castigo tambin podra considerarse una tcnica de extincin pues permite la disminucin o eliminacin de conductas, pero por conveniencia metodolgica slo se incluye como tcnica de extincin a cualquiera que no utilice estimulacin aversiva directa para lograrlo. Respecto a la conducta de escape, al necesitar la aplicacin de estimulacin aversiva previa a la respuesta, su extincin no reviste problemas si se elimina la posibilidad de que aparezca estimulacin aversiva o si la respuesta no permite que cese la estimulacin aversiva. Sin embargo, la extincin de la conducta de evitacin es ms compleja y por eso la trataremos ms ampliamente a continuacin. a) Evidencia y teoras sobre la persistencia de la conducta de evitacin Diversos autores coinciden al afirmar que la conducta de evitacin, como conducta defensiva (Bandura, 1969) ante situaciones ambientales aversivas, debe explicarse no slo mediante un anlisis conductual sino tambin mediacional cognitivo. Segn un mero anlisis conductual, para lograr la extincin bastara con eliminar la contingencia entre el ED y el Eav, es decir, presentar el ED sin Eav posterior. Sin embargo, esto no es eficaz para la extincin. En realidad, lo que se observa es una extraordinaria persistencia de la conducta de evitacin o, si se quiere, una gran resistencia a la extincin. Los primeros en demostrarlo experimentalmente fueron Solomon, Kamin y Wynne (1953). Estos autores entrenaron a unos perros en la conducta de evitacin en una caja de saltos bidireccional. En esta situacin, tras slo 10 ensayos de adquisicin EC-EI (EC= reduccin en la intensidad de la luz; EI= descarga elctrica; intervalo EC-EI= 10 segundos; se daba una descarga elctrica si no saltaban antes de

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

265

10 segundos en cada ensayo) no se produjo extincin durante 20 das a razn de 200 ensayos de extincin diarios. La extincin de la conducta de evitacin es pues sumamente difcil y si pensamos en las fobias como conductas de este tipo ante ECs anormalmente aversivos y la dificultad para eliminarlas, podremos comprender la importancia de este tema. Hay ms ejemplos cotidianos que tendran su explicacin dentro de estas cuestiones de la conducta de evitacin. As, Gray (1988; trad. cast. 1993, p. 211) sostiene que el aprendizaje de evitacin est implicado en el establecimiento de formas de comportamiento (tanto grupales como individuales) muy persistentes en el hombre. Ejemplos sociales o grupales tenemos: la disciplina militar, formas de comportamiento ritual propias de algunas religiones o sectas; un ejemplo de comportamiento ritual individual es el comportamiento obsesivo-compulsivo. En estos casos tenemos dos elementos: - Una serie de acciones o conductas que deben realizarse (sean razonables o absurdas, necesarias o intiles, sencillas o dificilsimas). - La omisin de estas conductas se castiga desde el primer momento (desde la infancia en el caso del obsesivo-compulsivo), conduciendo a una gran ansiedad posterior, de modo que aunque ya sea improbable el castigo (el grupo opresor, la institucin en la que se aplicaba el castigo, etc.), cualquier seal del entorno condicionada a ello seguir activando al menos el miedo o la ansiedad, y con ello la necesidad de llevar a cabo las conductas de evitacin correspondientes (rituales, etc.). La evitacin incluye pues otros componentes mediacionales decisivos para explicar su anormal persistencia o resistencia a la extincin, entre ellos la aparicin en su formacin de un estado emocional de temor, miedo y ansiedad que desde la teora bifactorial de Mowrer se sabe que surge como RC interna al EC aversivo y de manifestacin previa a la respuesta de evitacin. Para explicar esta resistencia a la extincin de la respuesta de evitacin, Solomon y Wynne (1954), en consonancia con la teora bifactorial de Mowrer, formularon el Principio de conservacin de la ansiedad. Este principio nos dice que el EC aversivo suele durar muy poco por la rpida aparicin de la respuesta de evitacin, con lo cual casi nunca se emite plenamente la RC de temor o ansiedad, y as es como sta se preserva y no se logra extinguir; parece pues que si se lograse extinguir la RC de miedo o ansiedad, tambin se extinguira la respuesta de evitacin. b) Procedimientos para acelerar la extincin de la conducta de evitacin Se han ensayado experimentalmente diversos procedimientos, algunos de los cuales pasaron a la aplicacin clnica. Describiremos aqu los ms importantes. SATURACIN DE EC Y BLOQUEO DE RESPUESTA: LA TCNICA DE INUNDACIN Esta tcnica, ya empleada por Solomon et al. (1953), es denominada tambin "exposicin forzada mediante prevencin de respuesta" segn Bandura (1969), y su derivacin clnica se conoce con el nombre de inundacin (flooding). Consiste en impedir la respuesta de evitacin al presentar repetidas veces el EC temido en ausencia del EI. De esta forma, la RC de temor se emite varias veces con toda su fuerza y se extingue. Segn Shipley (1974), lo importante es el tiempo total de exposicin al EC y tambin el aprendizaje de una nueva respuesta (la de inmovilidad) que interfiere con la respuesta de evitacin. Aunque ninguna de estas teoras ha sido del todo convincente, lo cierto es que este procedimiento produce una rpida extincin, aunque no est exento de efectos secundarios (alteraciones somticas por la intensidad de la emocin vivida, etc.). Se han investigado las distintas condiciones que afectan a la extincin mediante inundacin, y segn Tarpy (1981; trad. 1986, p. 363) seran las siguientes:

266

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

- Grado de control ejercido por el sujeto durante la inundacin: Si el sujeto puede controlar la terminacin del EC mediante la respuesta de evitacin, la extincin ser ms lenta que si no existe tal control (Katzev y Berman, 1974). - Tiempo de exposicin al EC: Cuanto mayor sea la duracin total de exposicin al EC o el nmero de ensayos de EC, mejor ser la extincin (Shipley, 1974; Bersh y Keltz, 1971). - Intensidad del EI: Cuanto mayor sea la intensidad peor extincin (Baum, 1969). TERMINACIN DEL EC DESPUS DE LA RESPUESTA DE EVITACIN Segn Adams (1980; trad. 1983, p. 120), si el EC durante la fase de extincin se retrasa ms all de la terminacin de la respuesta de evitacin, entonces el sujeto podr distinguir (discriminar) esta fase de la de adquisicin (en que el EC terminaba al comenzar la respuesta de evitacin). Katzev (1967) realiz un experimento para comprobar la eficacia de este mtodo utilizando ratas en una caja de saltos (donde EC = zumbador + luz, y EI = descarga elctrica). En los 200 ensayos de adquisicin los animales evitaban la descarga saltando (respuesta de evitacin) en los 5 segundos iniciales del EC (tras el salto cesaba el EC). Durante la fase de extincin hizo dos grupos: en el grupo I el EC terminaba con el inicio de respuesta de evitacin o a los 5 segundos si no ocurra la respuesta de evitacin. En el grupo II el EC continuaba 20 segundos despus de la respuesta de evitacin. Los resultados mostraron una menor resistencia a la extincin en el grupo II. De todas formas el experimento no est exento de crticas pues el grupo II tuvo una mayor exposicin al EC y, como vimos en la tcnica de inundacin, eso es un factor decisivo. CASTIGO DE LA RESPUESTA DE EVITACIN: CONDUCTA AUTOPUNITIVA Tambin Solomon et al. (1953) aplicaron este mtodo consistente en aplicar estimulacin aversiva al emitir la respuesta de evitacin durante la extincin. Pero paradjicamente el efecto de esta tcnica fue justo el contrario: aumenta la emisin de respuesta de evitacin, a pesar de que cuanto ms responda el sujeto ms castigo recibir. Este fenmeno se ha denominado conducta de "crculo vicioso", "autopunitiva" o "masoquista", y se ha estudiado ampliamente en aprendizaje animal. Varias teoras han intentado explicar este fenmeno: - La explicacin basada en la teora bifactorial dice que el castigo durante la extincin mantiene y aumenta el nivel de temor o miedo, lo cual hace que persista la conducta de evitacin y al castigar sta aumenta el miedo y la conducta de evitacin, y as sucesivamente. - Otra explicacin, llamada "teora de la confusin", segn Tarpy (1981; trad. 1986, p. 371), se basa en una falta de discriminacin entre adquisicin y extincin. Normalmente durante la extincin no debe aparecer el EI -como ocurra durante la adquisicin-, pero al hacerlo se confunde esta fase con la de adquisicin y por tanto no se puede discriminar ambas fases. Ambas hiptesis son compatibles, segn Dreyer y Renner (1971) y desde luego permiten concluir que no estamos ante un buen mtodo de extincin de la respuesta de evitacin. EXPOSICIN GRADUADA AL EC Se trata de introducir el EC progresivamente (en presentaciones de menor a mayor aversividad) de forma que no provoquen respuesta de evitacin. Es un procedimiento citado por Bandura (1969) y que combinado con procedimientos de contracondicionamiento es la base de tcnicas tales como la desensibilizacin sistemtica.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

267

6.4. Castigo 6.4.1. Definicin, caractersticas y lneas de investigacin


a) Definicin y caractersticas El castigo es un procedimiento en el cual una conducta establecida (previamente adquirida por condicionamiento de recompensa) es seguida por la presentacin de un estmulo o suceso aversivo (o la supresin de un suceso positivo), de forma que se logra reducir su frecuencia o se suprime. Aqu la estimulacin aversiva no funciona como reforzador negativo sino como estmulo punitivo. No ocurre antes de la respuesta sino que le sobreviene al sujeto tras ella. Su representacin simblica, siguiendo a Millenson y Leslie (1979) es bien sencilla: R Eav

Conviene, sin embargo, distinguir la definicin tcnica del castigo de su uso cotidiano. En el primer caso, se incluyen las condiciones adecuadas para el resultado de disminucin o supresin de la tasa de respuesta. En el segundo caso, a veces se dan las condiciones necesarias de efectividad y otras veces no e incluso de efectividad pero cuya aplicabilidad es tica y jurdicamente inviable (maltrato fsico, etc.). As, debe puntualizarse que el castigo no implica necesariamente dolor o coaccin fsicos, no es slo una pena impuesta por la ejecucin de un acto determinado. Por otra parte, muchas veces se aplica el castigo sin una relacin contingente con la respuesta; sirvan como ilustracin los siguientes ejemplo: - A los nios a veces se les "da una leccin" por su mala conducta sometindoles a algn sacrificio o escarmiento, aunque sea bastante despus de realizada; - los criminales reciben penas que no necesariamente disminuyen la frecuencia de sus actos criminales; - muchas veces el castigo fsico que un padre inflige a su hijo no es porque el nio haya hecho nada especialmente malo, sino por disgustos personales o matrimoniales que encuentran su desahogo en la violencia ejercida sobre el ms dbil (vase sobre este asunto el magnfico monogrfico que sobre maltrato infantil ha publicado la revista Infancia y Aprendizaje, 1995, n 71). En estos ejemplos, usualmente denominados de "castigo", efectivamente lo son pues hay estimulacin punitiva ulterior a la conducta, pero puede faltar lo decisivo en una definicin tcnica de castigo que es su efecto sobre la conducta (reduciendo su frecuencia o suprimindola) y una contingencia respuesta - castigo. b) Lneas de investigacin Respecto a las lneas de investigacin que se han seguido sobre el castigo, Pelechano (1980, p. 232) seala dos fundamentales: la que proviene del conductismo y el aprendizaje animal y la llevada a cabo en psicologa evolutiva: APRENDIZAJE ANIMAL La historia habra que iniciarla en Thorndike, quien en 1911 formul la ley del Efecto no slo en su aspecto positivo sino tambin negativo (la estimulacin aversiva debilita o elimina las asociaciones E-R establecidas), aunque en reformulaciones posteriores renunci a este principio pues obtuvo evidencia en humanos de que el castigo sobre respuestas errneas no mejoraba el rendimiento en las respuestas alternativas.

268

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

Posteriormente, Skinner (1938) y Estes (1944) comprobaron que el castigo no debilita la relacin entre estmulo y respuesta ni elimina la conducta sino que slo la suprime temporalmente. Estos resultados llevaron a la conclusin prctica de procurar la no utilizacin del castigo como medida disciplinaria y al abandono de la investigacin sobre este campo, hasta su relanzamiento en la dcada de los 60 con autores tales como Mowrer, Azrin, Church, Solomon, etc. PSICOLOGA EVOLUTIVA Nos referimos en este apartado a teoras influyentes sobre el desarrollo infantil, en las cuales se introducen explicaciones sobre el castigo. Inicialmente habra que citar las teoras de Freud y Watson. Freud, al hablar del proceso de "internalizacin" (por el cual el nio incorpora o asimila fundamentalmente las normas sociales) indica que se trata de pasar de un sistema de castigos y premios externos a otro interno (mediante sentimientos de culpa y/o ansiedad). El castigo aparecera pues como un procedimiento con efectos altamente desagradables y muy peligroso en los nios. Watson, por otra parte defendi en un principio, al menos tcitamente, sistemas de castigo para la crianza de los nios, aunque ms tarde corrigi dicha postura. Estas teoras llevaron a que de algn modo se paralizase la investigacin sobre el tema hasta recientemente en que ms bien (y puesto que en trminos sociales es un fenmeno y una prctica que no disminuye) se trata de analizar los aspectos positivos que pueda tener la aplicacin del castigo (efectividad y control de efectos nocivos secundarios).

6.4.2. Tipos de castigo: Castigo por aplicacin y por supresin


Craighead, Kazdin y Mahoney (1976; trad. cast. de 1981) distinguen dos tipos de castigo: Castigo por aplicacin y castigo por supresin. CASTIGO POR APLICACIN El castigo por aplicacin (de estmulos punitivos), tambin llamado castigo positivo, consiste en aplicar un estmulo aversivo despus de una respuesta. Por ejemplo, ser reprendido o "zurrado" despus de realizar cierta conducta, etc. Su esquema sera: R - Eav. Podran incluirse aqu procedimientos en los que la estimulacin punitiva es condicionada. Por ejemplo, las reprimendas verbales: Cuando se pretende que sean eficaces para suprimir conductas problemticas, se sabe que las suaves sern ms eficaces que las fuertes (stas ltimas conducen frecuentemente a un aumento posterior paralelo de las conductas perturbadoras). Drabman (1977) considera que las reprimendas verbales son un tipo de castigo por supresin, lo cual es bastante discutible pues no se pierde ningn reforzador; ms bien lo que aparece tras la respuesta es estimulacin punitiva condicionada, esto es, adquiere valor aversivo por asociacin previa con otros estmulos directamente aversivos. Otro ejemplo de castigo por aplicacin muy interesante en humanos (y un buen exponente de un castigo generalmente eficaz) es la restitucin o reestablecimiento del dao causado. En este caso, el castigo por algn tipo de conducta lesiva o daina (por ejemplo, romper deliberadamente un juguete al hermano) consiste en algn tipo de reestablecimiento o reposicin, incluso con creces, del dao causado (ahorrar hasta comprar al hermano otro juguete igual). Otro ejemplo se da cuando al nio que es sorprendido tirando un papel al suelo en el aula, se le hace recoger todos los papeles que haya en el suelo.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

269

CASTIGO POR SUPRESIN El castigo por supresin (de reforzadores), tambin llamado "castigo negativo" consiste en suprimir un reforzador positivo despus de una respuesta, por tanto no se aplica estimulacin punitiva directa. Su esquema es R - No Eref. Por ejemplo: - Perder privilegios por volver tarde a casa, - perder dinero por mal comportamiento, - retirada del carnet de conducir tras cometer una infraccin grave, etc. CRTICAS A ESTA CLASIFICACIN En realidad, es una clasificacin criticable desde un punto de vista tcnico de definicin del castigo. En particular, el castigo por supresin es perfectamente equiparable a la extincin del condicionamiento de recompensa. En aquel momento (vase Captulo 6), se insista en el aspecto operante de disminucin de tasa de respuesta, pero no se mencionaba el factor emocional de dolor o frustracin por la prdida del refuerzo. Esta confusin conceptual ha llevado a una divisin de opiniones entre los autores: los mismos procedimientos prcticos de reduccin o eliminacin de conductas se incluyen dentro de temas o captulos de castigo (por ejemplo, Drabman, 1977) o de tcnicas de extincin de condicionamiento de recompensa (por ejemplo, Milby, 1982). En cualquier caso, una descripcin de estos procedimientos se puede encontrar en el apartado 4.1.1. del Tema 4.

6.4.3. Condiciones para la efectividad del castigo


Cuando se mencionan las condiciones de efectividad del castigo, surge una clara confrontacin entre las condiciones de laboratorio y las de la vida real. Empezamos describiendo las primeras para despus comprobar en las segundas lo problemtico que puede resultar la utilizacin del castigo. a) Condiciones experimentales para la disminucin de la respuesta mediante castigo 1) Intensidad: A mayor intensidad, mayor supresin (ms completa y duradera) de la respuesta. Si la intensidad es baja se observa una recuperacin de la respuesta castigada. Una intensidad mediana produce una supresin parcial de la respuesta. Es ms eficaz variar la intensidad del castigo a lo largo del entrenamiento que mantenerlo constante. 2) Proporcionar respuestas alternativas: Una vez lograda la supresin de la respuesta, si no se ha llevado a cabo un entrenamiento en respuestas alternativas, el sujeto vuelve a recuperar la conducta castigada. La respuesta alternativa debe satisfacer el impulso (hambre, sed, etc.) en que se basa la tendencia de aproximacin o atraccin que ejerce la respuesta inicial. Adems, si se proporciona respuesta alternativa, el castigo puede ser de baja intensidad. Gray (1988; trad. cast. 1993, p. 143) menciona un impresionante experimento de Solomon al respecto: Unos cachorros de perro preferan comer carne normal en vez de carne granulada; para lograr que comieran carne granulada, los castigaba con un golpe en el hocico (dado con un peridico enrollado) al comer carne normal; sin embargo, les dejaba comer carne granulada. Fue un mtodo de adiestramiento eficaz pues cuando les daba slo carne normal algunos perros llegaron a morir de hambre (a los que segua dndoles carne granulada se la coman sin problemas). La eficacia fue mayor porque se castig una conducta consumatoria (comer) en vez de una conducta instrumental.

270

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

3) Duracin del estmulo punitivo: A mayor duracin mejor es la supresin de la conducta, aunque es muy probable que con una perturbacin emocional mucho mayor. 4) Presentacin repentina o gradual: El estmulo punitivo es ms eficaz si se presenta de modo repentino que si se hace de forma gradual, dado que en este ltimo caso se va produciendo una habituacin al estmulo aversivo. 5) Programas de castigo: Se trata de aplicar los mismos programas que se utilizaron con el refuerzo (vase Tema 4). El programa de castigo ms eficaz es el continuo (respuesta-castigo) tanto en animales como en humanos. En los de razn fija la eficacia es mayor cuanto mayor sea el volumen de estimulacin punitiva, y al aplicarlo se observa una disminucin progresiva de la tasa de respuesta. Con programas de intervalo se desarrolla una supresin anticipatoria, sobre todo con intervalos fijos (disminuye la frecuencia de respuesta antes de que se emita estimulacin punitiva). 6) Demora del castigo: Normalmente a menor contigidad espacio-temporal entre castigo y conducta menor eficacia del mismo. Sin embargo, en sujetos humanos este factor es menos importante. 7) Orden temporal en las secuencias premio - castigo: En una secuencia R instrumental - E reforzante - R consumatoria, segn el momento en que se aplique castigo (estimulacin aversiva), el resultado conductual ser diferente. Citemos dos posibilidades: - Secuencia castigo - premio: Con la secuencia R instr. - E av. - E ref., es decir, castigando la respuesta instrumental pero permitiendo la aparicin posterior del premio, paradjicamente, no se suprime la respuesta instrumental y adems la estimulacin aversiva hace de EC o seal de un estmulo reforzante posterior. Con todo ello se logra, mediante este contracondicionamiento (1 castigo, 2 recompensa), una mayor resistencia al castigo, es decir, una mayor resistencia a la extincin de la respuesta castigada. Es otra manifestacin de la conducta masoquista antes mencionada -recurdese que se produca conducta masoquista al castigar la respuesta de evitacin, con lo cual, tenamos una secuencia R instr. - E ref negativo (cese de EC) - E av.-. En humanos, esta bsqueda de estmulos dolorosos, tan extraa en la mayor parte de congneres, tendra explicacin en funcin de esta secuencia premio - castigo, tal y como comenta Gray (1988; trad cast. 1993, p. 148): supuestos una serie de experiencias condicionantes en la infancia en las que el dolor se ha seguido de una buena recompensa (y es fcil de imaginar que esto sucede normalmente). - Secuencia premio - castigo: Se trata de la secuencia R instr. E ref. R consumatoria E aversivo

En una secuencia como la del experimento de los cachorros de Solomon antes mencionado, produce el efecto contrario: una rpida extincin de la R instrumental y de la R consumatoria, pero tambin la aparicin de una intensa RC de miedo. En trminos coloquiales, algunos autores (por ejemplo Eysenck) sugieren que estos fenmenos estn involucrados de algn modo con el desarrollo de la conciencia moral. En efecto, al no emitir la respuesta, se produce una resistencia anticipada a la tentacin. Pero si alguna vez comete la respuesta prohibida, entonces el sujeto experimentar sentimientos de culpa. b) Condiciones ptimas de efectividad del castigo en contexto aplicados Craighead et al. (1976) sealan las siguientes:

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

271

1) Aplicacin inmediata del estmulo aversivo punitivo o supresin del refuerzo despus de la respuesta no deseada. De la misma forma que en el entrenamiento de recompensa, tambin en el caso del castigo interesa que haya la menor demora posible entre la conducta y su consecuencia. 2) Castigo de todas y cada una de las incidencias de la respuesta, es decir, para que el castigo sea eficaz debe aplicarse segn un programa continuo. Hay que notar que en caso de que el castigo no se produzca segn un programa continuo, ello implicar que todas las conductas no castigadas se estn dando porque tienen algn tipo de reforzamiento; por consiguiente, y de acuerdo con el efecto del refuerzo parcial ya estudiado, la conducta tender a mantenerse resistente a la extincin. En el caso del castigo suele ser an ms importante que en el caso de la recompensa una aplicacin consistente desde el principio del entrenamiento para optimizar su efecto. 3) Introduccin del estmulo contingente de castigo en su mxima intensidad (ms que con aumento gradual de severidad) pero, en el caso de humanos, con proporcionalidad entre la intensidad del estmulo punitivo y la fuerza de la conducta que se quiere extinguir (Marcos, 1994b, p. 86). Si la intensidad del castigo es desproporcionadamente elevada, se facilitar la induccin de efectos secundarios perjudiciales, segn ser comentado a continuacin; por el contrario, si el castigo es demasiado leve y las consecuencias extrnseca o intrnsecamente reforzantes de la conducta son ms importantes para el sujeto, lgicamente tal conducta tender a persistir. 4) Supresin de la motivacin para la respuesta no deseada. 5) Preparacin de una respuesta alternativa aceptable (en especial cuando no puede eliminarse la motivacin para la respuesta no deseada). Resulta crucial este factor de refuerzo de conductas alternativas, como una manera de reencauzar las motivaciones del sujeto en direcciones de respuesta diferentes. Si bien el castigo tiende a "dejar sin salida" las motivaciones de la persona, no tendr porqu haber demasiada persistencia en la conducta problemtica cuando el individuo encuentra fcilmente conductas diferentes y asequibles a sus capacidades que empiezan a resultar instrumentales para la satisfaccin de sus necesidades. 6) Refuerzo de las respuestas incompatibles con la respuesta castigada. En algunos casos particulares, la respuesta alternativa reforzada puede ser de hecho incompatible e incluso opuesta a la conducta que se desea extinguir. As, por ejemplo, un chico que tiene el hbito de morderse las uas, puede ser reforzado (mediante alabanzas o refuerzos intercambiables, por ejemplo) cada vez que, al percatarse de que va a iniciar el mordisqueo, cierra el puo o mete durante un minuto su mano en el bolsillo. 7) En seres humanos, una descripcin de la contingencia del castigo que permita que el sujeto sea consciente de por qu se le castiga. La aplicacin consistente del castigo sin explicaciones, tal como obviamente se hace con los animales en el laboratorio, da lugar a asociaciones representacionales sobre la contingencia del castigo, pero tales representaciones se ven facilitadas si la experiencia directa de castigo va acompaada por una explicacin verbal congruente. 8) An sealizaramos nosotros un ltimo factor o condicin para la ptima efectividad del castigo en humanos, y se refiere a que tal castigo est lo ms directamente posible relacionado con la conducta problema y sus consecuencias naturales. Un buen ejemplo de ello es la restitucin del dao que comentamos en un apartado anterior. Como vemos, se trata de un resumen o enumeracin con fines evidentemente prcticos de algunos de los factores sealados en el apartado anterior.

272

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

c) Efectos secundarios (perjudiciales) del castigo Aunque parece que siguiendo las normas antes citadas se podran obtener resultados positivos con el castigo, sin embargo no dejan de aparecer efectos perjudiciales, tanto por no lograr la supresin de la conducta castigada, como por la aparicin de efectos secundarios perjudiciales. Dichos efectos se pueden concentrar en cinco apartados: - Aparicin de respuestas emocionales negativas y/o problemticas.- La aplicacin de tcnicas de castigo sin alternativa de respuesta segn Walter y Grusec (1977) y con estimulacin punitiva intensa provoca ciertas alteraciones comportamentales y un incremento de la ansiedad y de la inhibicin comportamental. - Aparicin de conductas de evitacin del agente punitivo y del contexto de la situacin de castigo.Se llega a una evitacin del agente punitivo y del contexto ambiental o estimular con l asociado. Los efectos son fciles de imaginar en caso de aplicacin del castigo en nio, por ejemplo, en el mbito familiar (falta de comunicacin padres-hijos, etc.); o en el escolar (aversin al profesor, al colegio, al estudio, etc.). - Efecto rebote o incremento de la respuesta castigada en ausencia de la situacin (agente punitivo y contexto) de castigo.- Si se castiga una conducta problemtica que vena mantenindose previamente por condicionamiento de recompensa, se reducir dicha conducta, pero cuando deje de aplicarse el castigo no slo no se reducir la tasa de respuesta sino que se incrementar por encima del nivel que tena cuando sta era reforzada antes del castigo. Marcos (1994b, p. 87) pone un ejemplo muy ilustrativo:
Imaginemos que un nio comienza a fumar porque as obtiene cierto refuerzo social; sus padres le castigan cuando le ven fumando. Cuando el muchacho sea mayor y sus padres no puedan castigarle, entonces fumar ms que si no le hubieran castigado nunca.

Adems, al administrar repetidamente el castigo, los estmulos asociados al agente o situacin punitiva se condicionan, con lo cual, en ausencia de ese contexto la respuesta castigada se recupera con facilidad. Todo ello surge, evidentemente, al no conseguirse una verdadera supresin de la motivacin para la conducta. - Imitacin futura de la conducta castigadora.- El agente punitivo segn Pelechano (1980, p. 351) "se convierte en un modelo poderoso que castiga y promueve, en nios y adultos, conductas de castigo por modelado comportamental" (aprendizaje observacional). El sujeto castigado tiende a aprender que ese es el patrn de conducta pertinente para dirigir el comportamiento de los dems. - Persistencia de la motivacin para realizar la conducta problema.- Si no se proporcionan conductas alternativas a la castigada, el sujeto aprende a no hacer algo, es pues un aprendizaje asociativo de carcter negativo que puede que suprima una conducta observable, pero no la motivacin para hacerla, de modo que cuando pueda (est ausente el agente punitivo, etc.) volver a hacerla; se establece, en todo caso un conflicto aproximacin - evitacin que no se resolver hasta que se ofrezca la posibilidad de obtener el mismo refuerzo pero con otras conductas socialmente ms correctas. Dicho todo esto, es obvio que el uso aplicado del castigo debera restringirse a casos puntuales, nunca el castigo fsico, y siempre que no haya ningn procedimiento alternativo y aplicndolo con arreglo a las normas antes mencionadas.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

273

6.5. La prdida del control de la accin: Indefensin aprendida 6.5.1. Concepto y tcnicas experimentales
En el apartado anterior estudiamos la aplicacin de estimulacin punitiva contingente a la respuesta. Eran situaciones en las cuales el sujeto aprenda una relacin o asociacin entre su respuesta y una consecuencia negativa; en cierto modo, adquira un cierto control sobre su entorno pues aprende a no hacer algo por sus malas consecuencias o, en el caso de la evitacin, aprende a hacer algo para no sufrir malas consecuencias. En definitiva, con su conducta controla la situacin. Ahora bien, es posible que se aplique la estimulacin punitiva de forma no contingente a la respuesta. En estos casos, el sujeto con su conducta no tiene control sobre los acontecimientos y ello ser bastante negativo. De hecho, en la vida cotidiana no es algo infrecuente. Por ejemplo, en una situacin de desempleo, la persona comienza intentando diversas estrategias para conseguir un trabajo (presentarse a oposiciones, buscar enchufes, consultar bolsas de trabajo, apuntarse en una oficina de empleo, etc.); si transcurrido un tiempo no lo consigue, esa estimulacin aversiva (desempleo) persiste y no es contingente a las respuestas de evitacin (las estrategias de bsqueda antes mencionadas). Hay otras situaciones problemticas en las que hagamos lo que hagamos no las resolvemos pero su repercusin es ms o menos negativa segn su duracin, intensidad o posibilidades de escape. La investigacin experimental lleva desde 1967 estudiando sistemticamente dicho fenmeno. En esa fecha, Seligman y colaboradores (Overmier y Seligman, 1967; Seligman y Maier, 1967) expusieron a unos perros (en cajas de saltos) a una serie de shocks inescapables y despus observaron que estos animales eran incapaces de aprender una nueva conducta consistente en evitar o escapar de los shocks, esta vez s contingentes a dicha conducta. A dicho fenmeno se le llam learned helplessness, traducido por trminos diversos tales como desamparo, impotencia, desesperanza o indefensin aprendida, y cuya formulacin sera la siguiente: "Los organismos expuestos a una situacin incontrolable, con frecuencia muestran dficits posteriores en el aprendizaje de nuevas respuestas de xito" (Maier y Seligman, 1976). Experimentalmente no slo se ha demostrado en perros sino tambin en otros animales y tambin en humanos (vase Garber y Seligman, 1980, para revisin), sea con ruidos desagradables (Hiroto, 1974) o con anagramas irresolubles (Romero, Lpez y Diez, 1988). Segn Seligman (que es el principal investigador en este terreno), el concepto de indefensin describe al menos tres cosas diferentes: - Un procedimiento experimental: exposicin a consecuencias incontrolables, o sea, estimulacin aversiva que no se puede evitar, ni escapar ni es contingente a la respuesta. - Un efecto conductual: inactividad como resultado de tal operacin. - Un proceso, un fenmeno de aprendizaje consistente en la adquisicin de cogniciones especficas a tal procedimiento y responsables del efecto conductual. Las teoras elaboradas en torno a dicho fenmeno, adems de romper con las teoras tradicionales E-R al incluir variables mediacionales cognitivas (atribucin, expectativas), estn teniendo en la actualidad gran aplicacin en clnica, sobre todo en el campo de la depresin. Las tcnicas o procedimientos experimentales por los cuales se ha evidenciado la indefensin aprendida se describen en el Cuadro 3.

274

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

Cuadro 3: Tcnicas experimentales de adquisicin de la indefensin aprendida.

El paradigma experimental clsico de indefensin aprendida, tal y como se llev a cabo en los primeros experimentos de Seligman, se denomina diseo tridico. Aunque ha experimentado numerosas variaciones y crticas, lo cierto es que ha sido la tcnica ms utilizada. Supone dos fases: una de pre-tratamiento o de induccin y otra de prueba. - En la fase de pre-tratamiento se hacen tres grupos de sujetos: 1) Grupo escapable, que se somete a descargas escapables mediante procedimiento de escape o evitacin: Eav - R No Eav (Ref. neg.) 2) Grupo inescapable, idntico en todo al anterior ("acoplado al anterior") excepto en que la respuesta no impide ni afecta a la estimulacin aversiva previa: Eav - R Eav 3) Grupo control o inexperto pues no tiene experiencia de estimulacin aversiva. - En la fase de prueba todos los grupos son sometidos a un condicionamiento de escape o evitacin de modo que se mide y se compara la rapidez de adquisicin. Los grupos 1 y 3 suelen mostrar una mayor rapidez en la adquisicin que el grupo 2 que es ms lento por la interferencia de la fase aversiva inescapable no contingente. As pues, todos los procedimientos experimentales, tanto en humanos como en animales tienen el objetivo de conseguir que el sujeto perciba el no control sobre las consecuencias o sobre los acontecimientos. Con este mismo diseo tridico se han empleado diversos procedimientos en ambas fases (Ferrndiz, 1989): - En la fase de pre-tratamiento, en animales sobre todo se han utilizado descargas elctricas (por ejemplo, 60 descargas inescapables de 6 mA (miliamperios) y 5 segs. de duracin espaciados durante 3 horas). Con humanos hay ms variedad: . estimulacin aversiva o ruidos intensos molestos, . feedback negativo o positivo incontrolable, . fracaso inducido por el experimentador, . problemas discriminativos irresolubles, . puzzles irresolubles, . anagramas irresolubles, etc. - En la fase de prueba, con animales se emplea condicionamiento de escape y evitacin o laberintos. Con humanos: . resolucin de anagramas, . terminacin de ruidos intensos y . tareas de decisin lxica. Las medidas ms utilizadas han sido: - para aspectos motivacionales: latencia de respuesta, - para aspectos emocionales: cuestionarios y observacin conductual, y - para aspectos cognitivos: autoinformes, numero de ensayos para resolver problemas, nmero de errores, etc.

6.5.2. Efectos o resultados de la indefensin aprendida


a) Dficits En cuanto a los efectos de la indefensin aprendida, Seligman (1975) seala tres tipos de dficits: - Dficit motivacional: "Los acontecimientos incontrolables disminuyen la motivacin para iniciar respuestas voluntarias que controlan otros acontecimientos" (p. 62). - Dficit cognitivo: Una vez que se ha experimentado la incontrolabilidad resulta difcil aprender o percibir la eficacia de la respuesta (la incontrolabilidad distorsiona la percepcin del control). - Dficit emocional: Dicho dficit se define operacionalmente por la mayor incidencia de lceras y otra serie de trastornos psicofisiolgicos.

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

275

b) Generalizacin o transferencia Una vez inducida indefensin, se podr transferir a otras situaciones incluso dndose las siguientes caractersticas (Ferrndiz, 1989): - Siempre que en la fase de transferencia se empleen tambin estmulos punitivos. - Puede haber transferencia de una situacin traumtica (descarga elctrica) a otra no traumtica (prueba de laberintos). - Puede darse de tareas instrumentales (ruido inescapable) a tareas cognitivas (prueba irresoluble de anagramas).

6.5.3. Condiciones para la adquisicin de la indefensin aprendida


a) No contingencia R - C Es fundamental la experiencia de no relacin entre estimulacin aversiva y respuesta, hasta el extremo que determina la variable clave de la indefensin aprendida que es la incontrolabilidad. En este contexto, la controlabilidad es el estado psicolgico segn el cual el sujeto percibe hasta qu punto su accin controla o predice los acontecimientos. Si determinados acontecimientos se perciben como independientes de la respuesta entonces son "incontrolables", es decir, que ocurrirn haga lo que haga el sujeto. Si el acontecimiento afecta aversivamente al sujeto y lo percibe como no controlable entonces se inducir indefensin. b) Locus de control En lneas generales, sujetos con locus de control externo (o aquellos que creen que los refuerzos o castigos ocurren por azar o por circunstancias ajenas a su voluntad y que no son controlables), muestran mayor indefensin que los sujetos con locus de control interno (que creen que pueden "controlar" el refuerzo y que los premios o los castigos dependen de sus esfuerzos y/o capacidades). Estos ltimos tardan ms en inducir indefensin por prdida de autoestima. c) Autocontrol Determinadas conductas de autocontrol como el autorrefuerzo durante la fase de prueba dificultan la induccin de indefensin. d) Estimulacin aversiva inescapable repetida y previa En determinadas circunstancias el procedimiento de indefensin aprendida -y los dficits a l asociados- pueden evitarse si el entrenamiento previo en estimulacin aversiva es ms prolongado de lo habitual entonces no se produce indefensin. A este fenmeno lo denomin N. E. Miller endurecimiento (toughening up). Es un fenmeno descubierto en el laboratorio de Miller y descrito por Gray (1988; trad. cast. 1993, p. 150) en estos trminos:
Si el adiestramiento en la caja lanzadora era precedido, no de una nica sesin de choque inescapable, sino de 15 sesi ones, una diaria durante 15 das, el efecto disruptivo de la ltima sesin de choque en la respuesta de la caja lanzadora quedaba completamente eliminado (...). Hay que hacer notar que durante las repetidas sesiones de choque inescapable que permiten el endurecimiento, no hay recompensas con las que el choque pued a ser asociado. As, el endurecimiento parece ser un proceso no asociativo: el choque pierde su capacidad de desorganizar la conducta simplemente por el hecho de ser administrado de manera repetida.

276

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

El mismo autor sugiere que el endurecimiento es una posible explicacin a la tolerancia al estrs.

6.5.4. Por qu ocurre la indefensin aprendida (teoras explicativas)


a) Teoras iniciales TEORA DE LA INDEFENSIN APRENDIDA DE SELIGMAN Un organismo en una situacin de incontrolabilidad forma unas expectativas especficas negativas (haga lo que haga no conseguir evitar la estimulacin aversiva) y tiene unas consecuencias conductuales (triple dficit antes citado). Por tanto hay tres elementos fundamentales (Ferrndiz, 1989): - informacin sobre la no contingencia, - representacin cognitiva de la situacin (aprendizaje, expectativa, percepcin o creencia), y - dficits. TEORA DE LA INACTIVIDAD APRENDIDA Esta teora, formulada por varios autores, surge como reaccin a la anterior objetndole su recurso a constructos inobservables (expectativas) y por tanto se trata en este caso de una interpretacin ms acorde con las teoras tradicionales del aprendizaje. Segn esta teora, el sujeto ejecuta peor un aprendizaje posterior de escape (recordemos que en la situacin experimental de la caja de saltos, tras la exposicin a shocks no contingentes se permita situaciones de escape) por haber aprendido a ser inactivo durante la fase anterior de shocks inescapables. Dicha inactividad aprendida es incompatible con respuestas tales como "saltar", "apretar palancas", etc. y por tanto interfiere en el aprendizaje posterior. TEORA DE LA INACTIVIDAD INDUCIDA POR ESTRS Se refiere al hallazgo de Weiss (1968) de una reduccin del nivel de norepinefrina (metabolito de la noradrenalina que es una catecolamina y neurotransmisor que interviene en las sinapsis; es excitatorio y pertenece al sistema simptico) al someter al sujeto a shocks inescapables. Por tanto explica el fenmeno de la indefensin mediante un mecanismo neuroqumico, sobre todo con estimulacin aversiva de alta intensidad (si es de baja intensidad intervendra la teora anterior). b) Reformulaciones recientes de la indefensin aprendida en humanos Segn Vazquez y Polaino (1982), puede decirse que desde 1978 se ha producido un giro diferente en las teoras de la indefensin aprendida. En concreto, se ha reforzado el papel de variables cognitivas tales como el locus o lugar de control y las atribuciones (vase Captulo 2). Ya Seligman, en su obra de 1975 propona un mediador cognitivo que eran las expectativas de no control o de incontrolabilidad. Las reformulaciones aparecidas entre 1978 y 1980 (Abramson, Seligman y Teasdale, 1978; Abramson, Garber y Seligman, 1980), ofrecen una explicacin ms detallada y plausible de los mecanismos de formacin de dichas expectativas de incontrolabilidad. En concreto, se introduce la variable "atribucin" (una atribucin es la causa percibida de un evento) entre la percepcin de no contingencia y la expectativa de no contingencia futura. Es decir, la situacin actual de fracaso o problemas no escapables sirve de atribucin causal para igual situacin futura. Segn Vazquez y Polaino, la adquisicin de indefensin aprendida seguira los siguientes pasos o etapas: 1, situacin de no contingencia objetiva entre respuesta y consecuencia aversiva (la respuesta no hace cesar la estimulacin aversiva)

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

277

2, percepcin de no contingencia presente y pasada (el sujeto podra pensar: hasta ahora todo lo que hago no me sirve para resolver el problema) 3, atribucin de no contingencia pasada y futura (mis acciones no resuelven ni resolvern el problema) 4, expectativa de no contingencia futura (haga lo que haga no resolver el problema) 5, sntomas de indefensin. En este nuevo esquema, el mecanismo por el cual se establece la expectativa de no contingencia (consistente en el convencimiento de sujeto de que en el futuro la respuesta no causar el cese de la estimulacin aversiva por tanto no se responde) es la atribucin de no causalidad entre la respuesta y la estimulacin nociva (la respuesta no causa el cese de la estimulacin aversiva). El nuevo modelo no puede explicar la indefensin en especies infrahumanas pero s es til y aplicable a la indefensin en humanos, en donde las teoras anteriores no podan explicar dos fenmenos especficos como son: - la generalidad y la cronicidad de los dficits y - la prdida de autoestima. Esta prdida de autoestima resulta en principio algo paradjico pues si el sujeto perciba que ninguna respuesta era eficaz no tena por qu sentirse daado. Pero, como apuntan Vzquez y Polaino (1982), es posible que el individuo indefenso piense no ya que toda respuesta posible tenga consecuencia alguna en el medio, "sino que puede que crea que slo l mismo carece de ella" (p. 74) por falta de inteligencia, capacidad, etc. Habran pues dos tipos de atribuciones: - Atribuciones de no causalidad respuesta - consecuencia (la respuesta no produce consecuencias favorables de cese del problema o estimulacin aversiva). - Atribuciones de carencia de respuesta apropiada (no dispongo de respuestas para resolver el problema. Segn esto, la atribucin de no causalidad sera ms probable en individuos con locus de control externo (atribuyen la causa del problema a algo externo a ellos) mientras que la atribucin de carencia de respuesta apropiada sera ms propio de sujetos con predominio de locus de control interno. La reformulacin de Seligman no slo admite el papel de la atribucin causal sino la existencia de estilos atributivos en cada sujeto. Hay estilos atribucionales que infligen al sujeto una mayor vulnerabilidad a la indefensin que otros. Ya vimos en el Captulo 2 la propuesta de Seligman y colaboradores relativa a las tres dimensiones del estilo atribucional: - Interna / externa - Estable / inestable - Global / especfica Tal y como se explicaba en aquel captulo, un perfil atribucional interno - estable - global ser el de peor pronstico para inducir una actitud de indefensin o incluso estados depresivos. El perfil externo- inestable - especfico ser el ms favorable tras una situacin de incontrolabilidad o de fracaso -vase el Captulo 11 de Steiner (1988; trad. cast. de 1990) o Klein (1991; trad. cast. de 1994, pp. 322-331) para una ilustracin con ejemplos al respecto y en el apartado 7.2.2.a, en el Anexo 2 del Captulo 1-. Hay otros matices observados en cada estilo atribucional. As: - Si la atribucin es estable los dficits sern ms crnicos que si es inestable. - Los externos no tienen prdida de autoestima (no son los responsables de sus fracasos) y s los internos.

278

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

6.5.5. Repercusiones aplicadas de la indefensin aprendida


a) Tericas Habra que resaltar dos: Por un lado demuestra que la no contingencia produce un tipo de aprendizaje pasivo (se aprende a no hacer nada), hasta ahora no demostrado en condicionamiento clsico ni en condicionamiento instrumental (Maldonado, 1982) y, por otra parte, se propone una teora general del condicionamiento instrumental desde una perspectiva cognitiva, abriendo nuevos cauces a la investigacin. b) Prcticas La principal aplicacin prctica se ha centrado en la explicacin de la adquisicin de la conducta depresiva. El mismo Seligman (1975), propuso una explicacin de la depresin basada en la indefensin aprendida dada la similitud entre los sntomas de la depresin y los efectos conductuales de la indefensin aprendida, tal y como se ve de forma patente en la siguiente Tabla 3 (Maldonado, 1982). Este autor viene a decirnos que la depresin en humanos se produce por la expectativa de una incapacidad para controlar los eventos, al igual que en la indefensin. Pero no slo tiene una aplicabilidad clnica. Tambin se ha propuesto como etiologa de algunos fracasos escolares. En efecto, el nio que suspende asignaturas a pesar de su esfuerzo en estudiar puede adquirir un estado de indefensin aprendida que le provoque una dificultad aadida importante para lograr superar esta problemtica. Las soluciones a esta problemtica no son simples, aunque algunos autores se aventuran por esa lnea. Por un lado, habra que incidir en fortalecer la autoeficacia o competencia percibida que, segn Bandura (1986) permite a las personas continuar a pesar de un fracaso; por otro lado, Klein (1991) menciona las ventajas de tener un enfoque optimista de los problemas y sus soluciones, en contraposicin a un enfoque pesimista inductor de indefensin.
Tabla 3: Similitud de sntomas de la depresin y la indefensin aprendida (adaptado de Maldonado, 1982).

DEPRESION

INDEFENSION APRENDIDA

1. Pasividad ................................................................. 1. Pasividad 2. Conjunto de pensamientos negativos ..................... 2. Dficits cognitivos (dificultades en (pesimismo) aprendizajes de respuestas de xito) 3. Curso de tiempo ...................................................... 3. Curso de tiempo 4. Hostilidad introyectada ............................................ 4. Prdida de agresin 5. Prdida de peso, apetito, dficits ............................ 5. Prdida de peso, apetito, dficits sociales y sexuales sociales y sexuales 6. Decremento de norepinefrina .................................. 6. Decremento de norepinefrina

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva

279

7. PRCTICAS DE AUTOEVALUACIN DEL TEMA 5


5-1: Cuando se responde a la relacin entre dos o ms estmulos, ms que a sus propiedades absolutas, hablamos de: a) Contraste. b) Desviacin del vrtice. c) Encadenamiento. d) Transposicin. 5-2: Un nio ha aprendido a llamar pap a todos los hombres, pero cuando hace esto ve que nicamente un hombre le responde y los otros no. Este refuerzo diferencial le permitir al nio establecer adecuadamente: a) La discriminacin. b) El control de estmulos. c) El desvanecimiento. d) a y b son ciertas. 5-3: Generalizacin y discriminacin son: a) Procesos independientes entre s. b) Procesos directa y positivamente relacionados. c) Extremos de un continuo. d) Dos parmetros de medida de la fuerza de una respuesta. 5-4: Una mujer es maltratada por su marido cada vez que ste llega borracho a casa. Esta mujer est sometida a un modelo de: a) Castigo por aplicacin. b) Condicionamiento de escape. c) Entrenamiento de omisin. d) Indefensin aprendida. 5-5: Cuando existe relacin de causalidad entre una respuesta y la consecuencia de eliminar un estmulo agradable, hablamos de: a) Condicionamiento de recompensa. b) Escape o evitacin. c) Castigo por supresin. d) Entrenamiento de omisin. 5-6: Cul de las siguientes NO es una condicin adecuada para la aplicacin del castigo en humanos?: a) Hacer una descripcin verbal de la contingencia del castigo. b) Aplicarlo inmediatamente tras la conducta. c) Introducirlo gradualmente para evitar un excesivo trauma emocional. d) Castigar todas y cada una de las respuestas problema.

280

Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11

Anotaciones y observaciones

También podría gustarte