Está en la página 1de 40
-Analisis y Modificacion de la Conducta- -Lic. José Dahab- FELDMAN. - Aprendizaje - H.19% Aprendizaje ° 4 p B “ Be < i} Pr61lo0go: Unamigollamado Bo Un vistazo anticipatorio Elcondicionamiento clisico Fundamentos del condicionamiento Aplicacién de los principios del condicionamiento al comportamiento humano Extinci6n: el desaprendizaje de lo que hemos aprendido Recuperacién esponténea: el retorno de la respuesta condicionada Generalizacién y discriminacién Condicionamiento de orden superior ‘Mas alld del condicionamiento clisico tradicional: un desafio a los supuestos bisicos Recapitulacién, revisién y reflexién Condicionamiento operante Lalley del efecto de Thorndike Fundamentos del condicionamiento operante Reforzadores positivos, negativos y castigo Las ventajas y desventajas del castigo: por qué el reforzamiento supera al castigo Programas de reforzamiento: la administracién de las recompensas de la vida Discriminacién y generalizacién en el condicionamiento operante Conducta supersticiosa ‘Moldeamiento: el reforzamiento de lo que no ocurre en forma natural [Hi Los caminos de Ia psicologia: Lynne Calero Restriccionesbioldgicas del aprendizaj: a un pero viejo nose le puede ensenar cualquier truco Recaptulcion, revision y reflexion Enfoques cognitivo-sociales del aprendizaje Aprendizaje latente Aprendizaje observacional: el aprendizaje a través dela imitacién Laviolencia en la television y en el cine: jes relevante el mensaje de los medios de serch Ei TE ee Lo arene’ La controversia no resuelta de la teoria cognitivo-social del aprendizaje El Consumidor de pi del andlisis conductual yla mo. \cidn del comportamiento, Recapitulacién, revision y reflexion Una mirada retrospectiva Términos y conceptos clave Epflogo 187 188 Losanimales, como los perros guia ‘para ciegos, pueden ser entrenados ‘para que realicen tareas sorprendentemente complejas usando los principios basicos del aprendizaje icipatorio “Aprendizaje: un cambio de camportamiento reativament permanente producido por a experiencia Capitulo 5 Préiogo Un amigo llamado Bo ‘Cualquieta de nosotros sera afortunado de tener un amigo como Bo. Es un compafero maravilloso y leal que brinda de manera desinteresada tiempo y afecto. Siempre esté listo para ayudar y pide poco a cambio. Pero Bo fue entrenado para ser ast. Bo es una mezcla de labrador y cobrador dorado de cinco afios de edad es un perro entrenado para set un buen compaitero de su propietario, Brad Gabrielson. Ga- brielson presenta pardisis cerebral, por Io que tiene poco control sobre sus mtisculos, Pero con la ayuda de Bo, Gabrielson puede llevar una vida independiente. ‘Las capacidades de Bo son muchas. $i suena el timbre de la puerta la abr. Si Gabrielson tira algo, Bo fo levanta. Si Gabrielson tiene sed, Bo le dard una bebidas. En tuna ocasién, cuando Gabrielson se cayé, Bo salié del departamento y cruz6 el pasillo hasta Ta puerta de un vecino, donde rasc6 la puerta y ladr6. Cuando se percat6 de que €l vecino no estaba en casa, Bo subi las escaleras hasta el departamento de otro ve- cino. Cuando ese vecino, quien no se habfa encontrado con Bo antes, abrié la puerta, Bo lo condujo escaleras abajo, tirando de su mano con cuidado. Mientras el vecino ayudaba a Gabrielson, Bo permaneci6 vigilante a su lado. Gabrielson dijo después: “de haber estado solo, hubiera tenido que quedarme tirado all... hasta que mi novia legara a casa seis horas después”. Pero, continus: “Bo se acereé y me lami6 la cara, para asegurarse de que estaba bien, que respondfa. Luego salié a buscar ayuda” (Ryan, 1991, p. 14). Y Gabrielson dej6 de preocuparse. Es evidente que la pericia de Bo no aparecié nada més porque sf. Es el resultado de esme- ‘ados procedimientos de entrenamiento, mismos que estén en funcionamiento en nuestras vvidas, y que se ilustran por nuestra capacidad para leer un libro, conducir un autom6vil, jugar a las cartas, estudiar para un examen o realizar cualquiera de las numerosas activi- ddades que son parte de nuestra rutina cotidiana. Igual que Bo, cada uno de nosotros debe adquirir y después pulir sus habilidades y capacidades mediante el aprendizaje. “Tema fundamental para los psicélogos, el aprendizaje desempeiia una funcién cen tral en casi todas las reas de especializaciGn de la psicologia, como se verd alo largo de este libro. Por ejemplo, un psicélogo que estudia la percepei6n podria preguntar: “;c6mo aprendemos que la gente que se ve pequefia @ Ia distancia esté lejos, y no que es més pe uefa?” Un psic6logo del desarrollo preguntaria:“oémo aprenden los bebés a distinguir ‘asus madres de otras personas?”. Un psic6logo clinico podria cuestionar: “por qué algu- ‘nas personas aprenden a espantarse cuando ven una arafia?”. Un psicélogo social podria hacer la siguiente pregunta: “emo aprendemos a sentir que estamos enamorados?”. Ca- dda una de estas preguntas, a pesar de que proceden de distintos campos de la psicologis, s6lo pueden tener respuesta con relacién a los procesos de aprendizaje. {.Qué es lo que intentamos decir con aprendizaje? Aunque los psic6logos han iden tificado diversos tipos de aprendizaje, existe una definicién general que los abarca a {0 dos: aprendizaje es un cambio de comportamiento relativamente permanente, come resultado de la experiencia. Lo importante de esta definicién radica en que nos permite istinguir entre los cambios en el desempefio debidos a la maduracién (el desarrollo de patrones de comportamiento predeterminados biolégicamente que obedecen s6to a los ‘ios vividos) y aquellos cambios que la experiencia trae consigo. Por ejemplo, los nifios se convierten en mejores jugadores de tenis a medida que crecen, en parte como conse cuencia de que su fuerza aumenta con su tamaiio: un fendmeno de maduracién, Es prec ‘0 distinguir ese tipo de cambios provocados por la maduracién de aquellas mejoras aU ‘obedecen al aprendizaje, las cuales son consecuencia de la practica Aprendizaje De modo similar, es necesario distinguir entre Ios cambios de comportamiento a corto plazo provocados por factores distintos del aprendizaje, como una disminucién en al rendimiento debido a cansancio 0 a falta de esfuerzo, de los cambios debidos a un ver- adero aprendizaje. Por ejemplo, si Andre Agassi se desempetia mal en un juego de tenis como consecuencia de la tensién o la fatiga, ello no significa que no haya aprendido a ju- ‘aren forma adecuada o que haya olvidado c6mo jugar bien. La distincién entre aprendizaje y desempeiio es muy importante, y no siempre es ficil de realizar (Druckman y Bjork, 1994), Para algunos psicélogos, el aprendizaje s6lo se puede inferir de modo indirecto, mediante la observacién de cambios en el desempefio. Como consecuencia de que no siempre hay una correspondencia de uno a uno entre el sorendizaje y el desempeio, es dificil comprender cudndo se ha producido un verdadero sprendizaje. (Quienes hayamos reprobado un examen porque estabamos cansados y co- netiamos errores por descuido podemos comprender bien esta distincién.) Por otra parte, algunos psic6logos han abordado el aprendizaje desde otra perspecti- va muy diferente. Al considerar el aprendizaje sencillamente como cualquier cambio en el comportamiento, sostienen que el aprendizaje y el desempefio son una misma cosa: Es- te enfoque tiende a hacer a un lado al pensamiento que puede estar involucrado en el aptendizaje al enfocar tan s6lo el desempefio observable. Como veremos, el grado en que puede comprenderse el aprendizaje sin tener en cuenta los procesos mentales representa tuna de las dreas de mayor desacuerdo entre los te6ricos del aprendizaje de distintas orien- taciones, En resumen, comenzamos este capitulo examinando el tipo de aprendizaje que sub- yace a respuestas que van desde la salivacién de un perro cuando ve o escucha a su pro- Petario abrir una lata de alimento para mascotas, hasta las emociones que sentimos cuando escuchamos nuestro himno nacional. Después se exponen otras teorfas que consi- eran la forma en que el aprendizaje es una consecuencia de circunstancias recompensan- tes, Por Gltimo, examinamos los enfoques que se centran en los aspectos mentales del aprendizaje. EL CONDICIONAMIENTO CLASICO {Bl simple hecho de ver el logotipo de un restaurante de hamburguesas Te hace sentir re- totijones de hambre y pensar en ese alimento? Si es asf, entonces se trata de una forma rutimentaria de aprendizaje denominada condicionamiento clésico, Los procesos que subyacen al condicionamiento clésico explican fenémenos tan di- vvasos como Horar cuando se ve & una novia caminar hacia el altar en una boda, temer a Jaoscuridad o enamorarse del chico o la chica que vive enfente. Sin embargo, para com- Pender el condicionamiento clasico es preciso retroceder en el tiempo, hasta los primeros aos del siglo xx en Rusia Fundamentos del condicionamiento |Win Pavlov, fisilogo ruso, nunca pretendi6 realizar una investigacién psicol6gica. En 1804 obtuvo el Premio Nobel por sus trabajos acerca de la digestiGn, como estimulo a sus coatribuciones en ese campo. No obstante, a Pavlov no se le recuerda por sus investiga Ciones fisiolégicas, sino por sus experimentos acerca de procesos bésicos de aprendizaje, 'tabajo que comenz6 por accidente (Windholz, 1997). Pavlov estudiaba la secrecién de los écidos estomacales y la salivacién de los pe- ‘Mes como respuesta ala ingestin de distintas cantidades y clases de alimentos. Mientras lohacfa, se percaté de un fenémeno singular: algunas veces las secreciones estomacales |t saivacién comenzaban sin haber ingerido alimento alguno. Ver un plato de alimentos, ©. individuo que usualmente leva la comida, 0 hasta escuchar el sonido de sus pasos, {2 suficiente para producir la respuesta fisioldgica de los perros. La genialidad de Pavlov "ecic6 en su capacidad para reconocer las implicaciones de este descubrimiento tan bési- 139 rv D iQuéeselaprendizaje? > sComo aprendemos a crear aso- ‘iaciones entre estimulosy res ~ uestas? 190 Capitulo 5 ‘A lvin Pavlov (en el centro con barba blanca) se le conce mejor por sus contribuciones al campo del condicionamiento clisico. Condicionamiento elasico: tipo de aprenizaje ene eval un organismo responde ante wn estima neuro que por lo comiin no produce esa respuesta Estimulo neutro: esimulo que, antes del condicionamiento, no tiene efecto sobre la respuesta desea, Estimulo incondicionado (EN): ‘estimulo que provocs una respuesta sin ‘que se haya aprendido co, Se dio cuenta de que los perros no s6lo respondian con base en la necesidad biol6gica (hambre), sino también como resultado de un aprendizaje 0, como se le denomin6, de un condicionamiento clisico. En el condicionamiento clisico un organismo aprende a res- ponder aun estimulo neutro que normalmente no evoca esa respuesta. Para demostrar y analizar el condicionamiento clésico, Pavlov condujo una serie de experimentos (Pavlov, 1927). En uno de ellos colocé un tubo en la gléndula salival de ua perro, lo cual le permitié medir con precisin la cantidad de salivacién que éste product. Después hizo sonar un diapas6n y, segundos después, le mostraba carne molida al perro. Este apareamiento, planeado en forma cuidadosa para que transcurriera exactamente la ‘misma cantidad de tiempo entre la presentacién del sonido y de la care, ocurrié en repe tidas ocasiones. En un principio el perro s6lo salivaba al presentarle la carne molida, pero pronto comenz6 a salivar con sélo escuchar el sonido del diapas6n. De hecho, incluso Euando Pavlov dejé de mostrarle la carne motida, el perro salivaba después de escuchar él sonido, Se habia logrado un condicionamiento clésico en el perro para que salivara al cuchar el diapasén. ‘Como se puede ver en la figura 5.1, los procesos bésicos del condicionamiento el sico que subyacen a los descubrimientos de Pavlov son sencillos, aunque la terminolosit ue eligi tiene un aire téenico. Vea primero el diagrama de la figura 5.1a. Antes del cor dicionamiento, tenemos dos estémulos no relacionados: el sonido de un diapasén y Ia car ne molida, Sabemos que el sonido de un diapasén no conduce a la salivaci6n, sino @ une respuesta imrelevante como levantar las orejas o, tal vez, una reaccién de sorpresa. Por ello, el sonido en este caso se denomina estimulo neutro, puesto que no tiene efecto so bre la respuesta de interés, También tenemos came molida, la cual, como consecuencit del acervo biol6gico del perro, conduce de forma natural a la salivacién, la respuesta qve nos interesa condicionar. La came molida se considera el estimulo incondicionado (ED, debido a que todo alimento que se coloca en el hocico de un perro causa de inmediato s* Aprendizaje 1. Durante el condicionamiento Estimulo neutro “ Sonido del, \S~ diapason * Estimulo incondicionado (ED, Carne «¢. Después del condicionamiento Estimulo condicionado Respuesta condicionada Sonido det diapasén Salivacién < ivacién, La respuesta provocada por Ia carne molida (salivacién) se denomina respuesta, incondicionada (RI), una respuesta que no esté asociada con un aprendizaje previo. Las "espuestas incondicionadas son respuestas innatas naturales que no implican entrena- miento alguno. Siempre son provocadas por la presencia de estimulos incondicionados. La figura 5.15 ilustra lo que ocurre durante el condicionamiento. El diapasén suena de manera repetida justo antes de presentarse la carne molida. La meta del condiciona- niento radica en que el sonido del diapasén se asocie con el estimulo incondicionado (la 191 FIGURA 5.1 Proceso bésico del . probable que Alberto el sujto experimental de Watson, luso antes de que é1 haya tenido oportunidad de saludarla. ande por la vida temiéndole a Santa Claus? Describa qué es probable que sucediera para impedirlo. 4. La dolorosa vacuna que recibié Teresa en cada una de las vi sitas era un _—__, que provocé la Bene el punto de vista tedrico, deberta ser posible construir a eee, ‘una cadena infinita de respuestas de condicionamiento clés 4. El doctor Ramirez esté molesto debido a que su presencia se 0 de orden superior, de modo que los estimillos se asocien ha convertido en un ‘para el llanto| cn forma indefinida. ;Qué podria evitar que esto ocurriera en de Teresa los seres humanos? CONDICIONAMIENTO OPERANTE ‘May bien... Qué buena idea... Fantéstico... Estoy de acuerdo... Gracias... Exce- > :Cual es la funcién dela recom- lente... Formidable... Adelante... Este es el mejor trabajo que has escrito; tienes Pensa yel castigo en el aprendi un 10... Ya lograste conseguirlo... Estoy impresionado... Déjame darte un abra- aajet 20... Obtendrs un aumento... Toma una galleta.. Te ves estupendo... Te amo... Pocos pondrfamos objeciones al recibir cualquiera de los comentarios que aparecen ‘ariba, Pero lo digno de mencién es que cada uno de estos seneillos enunciados puede uti- lizarse para producir enormes cambios de comportamiento y para ensefar las tareas més complicadas por medio de un proceso denominado condicionamiento operante. Este con- ‘cionamiento constituye la base de gran parte del aprendizaje humano y animal de ma- yor importancia. El condicionamiento operante describe el aprendizaje en el que una respuesta vo- _ Condicionamiento operante: Iuntaria se fortalece 0 debilita, segdin sus consecuencias sean positivas o negativas. A di- aprendizajeenel que se fonaece 0 ferencia del condicionamiento elésio, en el que los comportamientos originales son las $bits un respuesta volunaris, ‘espuestas biolégicas naturales ante la presencia de estimulos como alimento, agua 0 do- eee ae lor, el condicionamiento operante se aplica a las respuestas voluntarias, que son realiza- (ks deliberadamente por un organismo con el fin de producir un resultado deseable. El ‘émino “operante” destaca este punto: el organismo opera en su entorno para producit ‘lgdn resultado descable. Por ejemplo, el condicionamiento operante esta funcionando Cuando aprendemos que trabajar con esmero puede generar un aumento salarial, 0 que es- ‘utiar con ahinco trae consigo buenas calificaciones. 198 FIGURA5.2 Edward L. ‘Thomdike disend esta caja de ‘escape para estudiar el proceso ‘mediante el cual el gato aprende a pisar un pedal para escapar de la caja y recibir alimento. B. F. Skinner, quien fue el padre {fundador del condicionamiento ‘operante, desarroll6 el aparato que se-conoce como “caja de Skinner”. FIGURA 5.3 Una caja de Skinner ‘empleada para estudiar el ‘condicionamiento operante. Los fanimales de laboratorio aprenden a ‘primi la palanca a fin de obtener falimento, el cual es entregado por tun despachador. Capitulo 5 ‘Como ocurrié con el condicionamiento clisico, las bases para comprender el condi. cionamiento operante se determinaron mediante experimentos con animales. Ahora nos teferiremos a algunas de las primeras investigaciones, que comenzaron con un sencilla estudio acerca del comportamiento de los gatos. Laley del efecto de Thorndike Si coloca a un gato hambriento dentro de una jaula y luego deja un poco de alimento afuera de ella, es muy probable que el gato trate de hallar el modo de salir de la jaula, El gato primero hurgaria con sus garras por los costados o intentarfa salir a través de una abertura, Sin embargo, suponga que usted arreglé la jaula para que el gato pudiera esca- par sipisa una pequetia palanca que quita el cerrojo de la puerta (véase figura 5.2). En al ‘gin momento, al moverse dentro de la jaula el gato pisarfa la palanca, la puerta se abiria y el animal comerfa el alimento. {QUE ocuiriria si de nuevo coloca al gato en el interior de la jaula? Es probable que 1 gato emplearfa un poco menos de tiempo para poner su pata sobre la palanca y escapar de la jaula. Después de varios ensayos, el gato pisarfa deliberadamente 1a palanca tan pronto como lo metieran en la jaula. Lo que ocurri6, segsin Edward L. Thorndike (1932), Guien estudis esta situacién en forma extensa, es que el gato aprendié que pisar la palanca festé asociado con la consecuencia deseable de obtener el alimento. Thorndike resumi6 es- ta relaci6n al formular la ley del efecto, que establece que las respuestas que generan si- fisfaccién tienen més posibilidades de repetirse, lo cual no sucede con las que no la producen, que tienen menor probabilidad de repetirse. "Thorndike crefa que la ley del efecto operaba en forma tan automiética como las ho- jas que caen de los drboles en el otoiio. No era necesario para un organismo comprender {que habia un nexo entre la respuesta y la recompensa. En lugar de ello, pensaba que alo largo del tiempo y por medio de la experiencia, el organismo formaria una conexién di- recta entre el estimulo y la respuesta, sin tener conciencia de la existencia de dicha cone- xi6n, Fundamentos del condicionamiento operante Las primeras investigaciones de Thorndike sirvieron como fundamento de Ia labor reali- zada por uno de los psicélogos de mayor influencia en el siglo xx, B. F. Skinner, quien falleci6 en 1990. Es posible que haya ofdo hablar de la caja de Skinner (que se muestra en tuna de sus formas en la figura 5.3), una cémara con un ambiente altamente controlado ‘empleada para estudiar procesos de condicionamiento operante con animales de laborat- fio. Mientras la meta de Thorndike era que sus gatos aprendieran a salir de la jaula para Patanca ——} Despachador —} de alimento Tel Aprendizaje T -<% f dese "Ah, no me que, La lz se enciende, primo lapalanca y ellos me pagan ‘Waticémote va? ‘ttener alimento, los animales de la caja de Skinner aprendian a obtener alimento operan- doen el ambiente interno de la caja. Skinner se interes6 en determinar las variaciones del comportamiento como resultado de alteraciones en el entorno. A Skinner, cuya labor se extendié més allé del perfeccionamiento del aparato ini- cial de Thomdike, se le considera el padre de toda una generacién de psicélogos interesa- os en el condicionamiento operante (Delprato y Midgley, 1992; Bjork, 1993; Keehn, 1996). Para ilustrar la contribucién de este psicélogo, veamos lo que le ocurre a un pi- chin en una caja de Skinner tipica. Suponga que quiere ensefar a un pich6n hambriento a picar en una tecla que esta colocada en la caja, Al principio el pichén dard vueltas alrededor de la caja, explorando el ¢entorno en forma aleatoria, No obstante, es probable que en algtin momento dé un picota- 20a a tecla por simple azar, entonces recibiré una bolita de alimento. La primera vez que asiocurra el pichén no aprenderd la conexién existente entre el picotazo y recibir alimen- to, y seguir con su exploracién, Tarde 0 temprano el pichén volverd a dar un picotazo a latecla y recibird su alimento; con el tiempo la frecuencia de la respuesta de los picotazos nla tecla se incrementard. Al final, el pichén daré picotazos a la tecla hasta saisfacer su hambre, lo cual demuestra que ha aprendido que recibir comida esté relacionado con ese ‘comportamiento. Réforzamiento del comportamiento deseable ‘Skinner am6 “reforzamiento” al proceso que lleva al pichén a continuar picoteando la ‘ecla. El reforzamiento es el proceso por el que un estimulo incrementa la probabilidad de repetir un comportamiento precedente. En otras palabras, es mas probable que ocurran de auevo los picotazos debido al estimulo del alimento, En una situacién como ésta, al alimento se le denomina reforzador, el cual es cual- ‘hier estimulo que incremente la probabilidad de que un comportamiento antecedente 199) Dibujado por Cheney; © 1993 The ‘New Yorker Magazine, Inc Reforzamiento: proceso pore que ‘un estimulo inerementa la probabildad de que se epetir un comportamiento precedente Reforzador: cualquier estinulo que ‘increment Ia probabilidad de que ‘curtzd de nuevo un comportamiento precedente Respuestas a las preguntas de revision: frendizaje; maduracién 2, Pavlov; clisico 3, estimulo incondicionado; respuesta incondicionada 4. estimulo condicionado S-tespuesta condicionada 6. extinciGn 7. generalizacin de estimulos; diseriminacién de estimulos 200 COv— Reforzador positive: estilo que se agrega al ambiente y que preduce un increment de na respuesta precedente Reforzador negativo: emocién en ambiente de un estimulo desaradable, la eal conduce aun ineremento en la probebiidad de que una respuesta prece- ‘ente ceux de nuevo ene futuro Capitulo 5 ocurra de nuevo. Por consiguiente, el alimento es un reforzador, puesto que aumenta lz probabilidad de que ocurra el comportamiento de dar picotazos a Ja tecla (denominado formalmente la respuesta de dar picotazos) {.Qué clase de estimulos pueden actuar como reforzadores? Los premios, los jugue- tes y las buenas calificaciones pueden servir como reforzadores, si fortalecen una res. puesta que se da antes de su introduccién. En cada caso, es importante que el organismo aprenda que la aparicién del reforzador es contingente con la ocurrencia de la respuesta en primer lugar. or supuesto que no nacemos con el conocimiento de que podemos comprar un chocolate con dos monedas. En lugar de ello, aprendemos por medio de la experiencia {que el dinero es un bien valioso debido a que lo asociamos con estimulos como el alimen- to, la bebida o el abrigo, reforzadores naturales. Este hecho sugiere que puede establecer se una distincién entre reforzadores primarios y secundarios. Un reforzador primario satisface alguna necesidad biol6gica y funciona de modo natural, independiente a la ex. periencia previa de una persona. El alimento para alguien que siente hambre, el calor para ‘quien tiene fro y el alivio para el que experimenta dotor deben clasificarse como reforza- dlores primarios. En contraste, un reforzador secundario es un estimulo que funciona co- ‘mo reforzador en consecuencia de su asociacién con un reforzador primario. Por ejemplo, sabemos que el dinero es valioso debido a que hemos aprendido que nos permite obtener ‘otros objetos deseables, incluyendo reforzadores primarios como la comida y el abrigo En este sentido, el dinero se convierte en un reforzador secundario. Lo que convierte a algo en un reforzador depende de preferencias individuales. En tanto que un chocolate puede ser un reforzador para una persona, un individuo al que le disguste el chocolate podria encontrar més deseable el dinero. El tinico modo en que po- ‘demos saber si un estimulo es un reforzador para determinado organismo es observa sila tasa de respuesta de un comportamiento que ocurrié antes aumenta con posterioridad ala presentacién del estimulo. Reforzadores positives, negativos y castigo En muchos aspectos, los reforzadores se pueden concebir en funcién de recompensas; tanto un reforzador como una recompensa incrementan la probabilidad de que se repits ‘una respuesta previa. Pero el término “recompensa” se limita a las ocurrencias positivas, y en esto radica su diferencia de los reforzadores, puesto que éstos pueden ser positivos 0 negativos. Un reforzador positive es un estfmulo que se afiade al entorno y que trae consigo ‘un incremento de la respuesta precedente. Si se otorga alimento, agua, dinero o elogios después de una respuesta, es més probable que ésta se repita en el futuro. El salario que reciben los trabajadores al término de la semana, por ejemplo, aumenta la probabilidad de que regresen a sus trabajos la semana siguiente. En contraste, un reforzador negativo se refiere a la climinacién en el ambiente de un estimulo desagradable, la cual conduce a un aumento en la probabilidad de que la res- ‘puesta precedente ocurra de nuevo en el futuro. Por ejemplo, si tiene sintomas de resfrio (un estimulo desagradable) que se eliminan al ingerir una medicina, es més probable que Ja tome la préxima vez que experimente es0s sintomas. En este sentido, tomar la medic rna es un reforzador negativo, debido a que elimina los sintomas desagradables del resfria- do, De modo similar, sila radio tiene un volumen muy alto y le lastima Ios oftos, seguto tencontraré que bajar el volumen alivia el problema. Bajar el volumen es reforzante et forma negativa y tendré mas probabilidades de repetir esa acci6n en el futuro. Por tanto, el reforzamiento negativo le ensefia a un individuo que la realizacién de una accién elimi- ‘na una condicién negativa existente en el entoro, Al igual que los reforzadores positivos, Jos negativos incrementan la probabilidad de que se repita ¢l comportamiento precedente El reforzamiento negativo ocurre en dos tipos de aprendizaje: el condicionamiento de escape y el condicionamiento de evitacién. En el condicionamiento de escape el org rismo aprende a dar respuestas que ponen fin a una situacién aversiva. El condiciont Aprendizaje rniento de escape es un lugar comiin, y suele ocurrir con rapidez. Por ejemplo, los nifios np tardan mucho tiempo para aprender a alejar sus manos de un radiador caliente, De mo- go similar, los estudiantes atareados que se toman un dia para evitar la tensién que les juce gran cantidad de trabajo exhiben un condicionamiento de escape. El condicionamiento de evitacién, en contrast, tiene lugar cuando un organismo responde a una sefial de que ocurriré de manera inminente un suceso desagradable, de modo que se hace posible su evasién. Por ejemplo, una rata aprende con rapidez a accio- rm una palanca para evitar una descarga eléctrica que se da después de un sonido. Del rnismo modo, Ios conductores de automéviles aprenden a Henar sus tangues de combusti- tle a fin de evitar que se les termine la gasol Es importante notar que aun cuando el reforzador negativo consiste en vn condicio- ramiento de escape o de evitacién, no es lo mismo que un castigo. El castigo se refiere a cestimulos desagradables 0 dolorosos que disminuyen la probabilidad de que ocurra de rmevo el comportamiento precedente. En contraste, al reforzador negativo se le asocia ‘con la remocién de un estimulo desagradable 0 doloroso, Io cual produce un incremento del comportamiento que puso fin al estimulo desagradable. Si recibimos una descarga céetrica después de determinado comportamiento, estamos recibiendo un castigo; pero si recibimos la descarga eléctrica y hacemos algo para ponerle fin, se considera que el com- portamiento que pone fin a la descarga ha sido reforzado en forma negativa. En el primer ‘aso, un comportamiento especifico es capaz de disminuir como consecuencia del casti- 49; en el segundo, es mas probable que aumente debido al reforzamiento negativo (Azrin yHolt, 1966). ‘Aunque se suele considerar al castigo en funcién de la aplicacién de algtin estimulo aversivo, como una nalgada por portarse mal o diez. afios de cdrcel por haber cometido un éelito, también puede consistir en la remoci6n de algo positivo. Por ejemplo, cuando se le dice a una adolescente que no podra utilizar el automévil familiar por sus malas califica- ‘cones, 0 cuando informan a un empleado que se le ha disminuido el salario debido a sus resultados deficientes en las evaluaciones de desempefio, se est administrando un castigo ena forma de la remocién de un reforzador positivo. Las distinciones entre las clases de castigo, as{ como entre el reforzamiento positi- vo y negativo, pueden parecer confusas al principio, pero las siguientes reglas empiricas (yelresumen del cuadro 5-1) le pueden ayudar a distinguir entre ambos conceptos: }Guadr6 5=1.| Tipos de reforzamiento y castigo Naturaleza Cuando el éstimulo se agrega, Cuando el estimulo se elimi- delestimulo el resultado es... 1na ose termina, el resultado Positive Reforzamiento postive Castigo por remocion eases) _Bjemplo: torgar un aumento jemplo:reirar el juguete por el buen desempetio. favorito después de un mal comportamiento Resultado: aumento de a fre- Resultado: disminucién dela ‘cuencia de a respuesta (buen de- frecuencia dela respuesta (mala sempetio) conducta) Negativo Castigo por aplicacion Reforzamiento negative ‘Geragradable) Ejemplo: dar nalgadas después de _Ejemplo: pone ina una jaqueca ‘un mal comportamiento ingriendo una aspirina Resultado: disminuciin dela fe- Resultado: aumento dela ccuencia del comportamiento frecuencia de a respuesta (inges- (mala conducta) tin de aspirinas) 201 Castigo: estimulos desagradables 0 ‘oloroeos que disminuyen la ‘probabildad de que un comportaniento precedente ocurriré de nuevo CQpvinw & Capitulo 5 + El reforzamiento incrementa el comportamiento que le precede; el castigo lo dis. minuye + Lacaplicacén de un estimulo posiiv trae consigo un ineremento del comport tnientoy se denomina reforzamiento postvo; Ia remocién de un estilo positive disminuye el eomportamiento debido ala omisign del reforzamiento y se denoming castigo por remocién + Laaplicacién de un estimulo negativo que disminuye o reduce el comportamiento se denomina castigo por aplicacién; la remocién de un estimulo negativo que pro- ‘voca un incremento del comportamiento se denomina reforzamiento negativo. Las ventajas y desventajas del castig. por qué el reforzamiento supera al castigo {El castigo es un medio efectivo para modificar el comportamiento? A menudo el castigo representa el camino més corto para modificar comportamientos que, si se permite que contintien, podrfan ser peligrosos para el individuo. Por ejemplo, un padre tal vez no Ile {gue a tener una segunda oportunidad para advertira su hijo que no corra hacia una calle donde transitan muchos vehiculos, de modo que el castigo en Ia primera vez que ocurre este comportamiento puede ser una eleccién sensata. Es més, el empleo del castigo para suprimir el comportamiento, aunque sea en forma temporal, proporciona la oportunidad de reforzar a una persona para comportarse de forma més deseable en lo subsecuente En algunos casos, el castigo puede ser la forma més humana de tratar determinados problemas psicolgicos profundamente arraigados. Por ejemplo, algunos nifios padecen de trastomo generalizado del desarrollo (autismo), un extrafio trastorno psicolégico en el {que se pueden lastimar a si mismos, rasgéndose la piel o golpedndose la cabeza contra la pared, lo cual puede provocarles mucho dato. En estos casos se ha empleado el castigo en la forma de uia descarga eléctrica breve pero intensa, lo que en ocasiones ha dado re- sultados notables para evitar el comportamiento de lesionarse a si mismos cuando todos los demés tratamientos han fracasado. Sin embargo, dicho castigo se emplea s6lo como tratamiento de Gltimo recurso para mantener al niffo seguro y ganar tiempo hasta que se puedan iniciar procedimientos de reforzamiento positive (Lovaas y Koegel, 1973; Lins cheid et al., 1990; Siegel, 1996). Hay diversas desventajas que hacen cuestionable el uso cotidiano del castigo. Por ‘una parte, por lo regular no resulta efectivo, en particular si el castigo no se aplica poco después del comportamiento que se desea suprimir o si el individuo es capaz de retirarse del entomo en el que se administra el castigo. Un empleado regaiiado por el jefe puede renunciar; un adolescente que pierde el derecho de usar el automévil de la familia pue- de pedir prestado el de un amigo; en estas circunstancias, el comportamiento inicial cau- sante del castigo puede ser remplazado por otro incluso menos deseable. Por atin, el castigo fisico puede generar en quien lo recibe Ia idea de que la agresién fisica es algo permisible, e incluso quizé deseable. Un padre que grita y golpea a su hijo ‘porque se port6 mal Ie esté ensefiando que la agresién constituye un comportamiento adul- to adecuado, En este contexto, el hijo puede imitar pronto el comportamiento de su padre ¥ actuar agresivamente con los demis. Asimismo, el castigo fisico a menudo lo administran personas que se encuentran enojadas o iracundas. Es poco probable que individuos en se- rejante estado emocional sean capaces de pensar en lo que hacen o de controlar el grado del castigo que aplican. En titima instancia, quienes recurren al castigo fisico corren el riesgo de despertar temor en los demés. ira desventaja es que sino se logra que las personas castigadas entiendan las raz0- nes para su castigo (es decir, que el castigo tiene como fin la modificacién del comporta- ‘miento y, por lo tanto, es independiente del concepto que tiene de ellos como individuos ‘el encargado de su aplicacién), éste puede provocar una disminuciGn de su autoestima. Por iitimo, el castigo no transmite informaciGn acerca de cu‘l puede ser un com portamiento alternativo més apropiado. Para servir como generador de un comportamien- Aprendizaje 203 A pesar de sus desventajas conocidas, el castigo se emplea con frecuencia en diversas situaciones. 1b més deseable en el futuro, el castigo debe ir acompafiado de informacién especifica acerca del comportamiento que se esti castigando, y de sugerencias detalladas respecto a tun comportamiento més deseable, Castigar a una nifia por mirar a través de la ventana ede levarla en lugar de ello a mirar al piso. A menos que le ensefiemos formas apro- fiadas de responder, no habremos hecho més que sustituir una forma de comportamiento indeseable por otra. Si el castigo no es seguido por reforzamiento del comportamien- tb subsecuente que resulte mas adecuado, sera poco lo que se logre En sintesis, reforzar el comportamiento deseable es una técnica més apropiada que cl castigo para modificar el comportamiento. Por consiguiente, tanto dentro como fuera el campo de la ciencia, el reforzamiento por lo general supera al castigo (Sulzer-Azaroff y Mayer, 1991; Seppa, 1996), Programas de reforzamiento: la administracién de las recompensas de la vida 1 mndo serfadistnto silo jugadores de cartes abandontran el juego después de perdce i primera mano, silos pescadore rlornaran a la costa en cuanto no eneoataran pesca 0 silos vendedores ambulantes dejaran de vender la primera vez que los rechazara en una casa, El hecho de que dichos comportamientos no reforzados continten, a menudo con mucha frecuencia y persisenca, lata la particulrided de que el reforcamiento no nece- sta recibrse continuamente ara que se aprenda y mantenga el comportamiento. De be- dho, el comportamiento que slo se refuerza de modo ocasional a finde cuentas puede ‘prenderse mejor que el comportamiento que se refuerza siempre. Cuando hablamos de la frecuencia y oportunidad del reforcamiento que sigue 4 comporiamiento deseable, se hace referencia alos programas de reforzamlento. El Programas de reforzamientot ‘comportamiento que es reforzado todas las veces que se manifiesta se encuentra bajo un la frecuencia y oportunidad det Programa de reforzamiento continuo; si se le refuerza en algunas ocasiones, pero no en Tforzamento que sigue al ‘oda, esté sometido a un programa de reforzamiento parcial. Aunque el aprendizaje se CmPa"™amieno deseado rudoce con mds rapidez bajo un programa de reforeamienio contimo, el comportamica- Programa dereforsumiento ‘iene mayor duracin una vez que ces el reforzamiento si se aprende bajo un progra- continu compares que tha de reforzamiento parcial. reforzado cada vez que ocurre Por qué los programas de reforzamiento parcial llevan a un aprendizaje més firme . 9 duadero que los programas de refrzamiento continuo? Podemos responder a la pre- Programa dereferzamiento {untaexaminando cémo nos comporterfamos al utlizar una méquina expendedora de e- Pawcate ates nese os tat 204 Capitulo 5 La plumilla se reinicia en este punto Una pausa en las respuestas Plumilla Respuestas El papel se mueve en esta direccién ‘a.una velocidad determinada, para indicar el transcurso del tiempo FIGURA 5.4. Un registrador acumulativo. Conforme se desenrolla el papel lentamente, ta plumilla indica euando se ha producido wna respuesta haciendo wna muesca hacia arriba. Las pausas en las respuestas son indicadas por una falta de movimiento hacia arriba de la linea, Como en el caso de este ejemplo, es tfpico que el tempo entre las respuestasiniciales disminuya conforme el organismo aprende a dar la respuesta. Programa de razén fija: programa nel que el reforzamiento se da s6lo ‘después de la ejecucin de determinado mero de respuestas frescos en comparacién con tuna maquina tragamonedas de juegos en Las Vegas. Cuando utilizamos la primera, la experiencia ha demostrado que cada vez, que introducimos unas ‘monedas nos debe ser entregado el reforzamiento: un refresco, En otras palabras, el pro- rama de reforzamiento es continuo, En comparacién, una méquina de juegos ofrece un programa de refuerzo parcial; después de introducir unas monedas, la mayoria de las ve~ ces no recibiremos nada a cambio, No obstante, al mismo tiempo sabemos que en algunas cocasiones ganaremos algo. ‘Suponga ahora que, sin que lo sepamos, tanto la méquina de refrescos como la de juegos estén descompuestas, por lo que ninguna de las dos puede entregaros nada. No pa- sar mucho tiempo antes de que dejemos de introducir monedas en la méquina expendedo- 1a de refrescos descompuesta; por mucho trataremos dos o tres veces antes de alejarnos rmolestos de ella. Pero la historia seria muy distinta con la méquina de juegos. En este caso {ntroducirfamos dinero por un periodo més largo, a pesar de no recibir respuesta alguna, En términos formales, podemos ver la diferencia entre ambos programas de refor zamiento: los programas de reforzamiento parcial (como los que ofrecen las maquinas de juegos) mantienen la ejecucién por periodos més largos que los programas de reforz ‘miento continuo (como los de las méquinas vendedoras de refrescos) antes de que se pro- ‘duzca la extinci6n, es decir, la desaparicién de la respuesta condicionada. Con el empleo de un registrador acumulativo, aparato que registra y grafica en for- ma automética el patrén de respuestas que se dan como tna teaccién ante un programma espectfico (véase figura 5.4), los psicdlogos del aprendizaje han descubierto que determi- nadas clases de programas de reforzamiento parcial producen respuestas mds fuertes y duraderas antes de Ia extincién que otros (King y Logue, 1990). Aunque han sido exami- nados distintos programas de reforzamiento parcial, es posible agruparlos en dos catego- rfas: aquellos que toman en cuenta el niimero de respuestas ejecutadas antes de que presente el reforzador, a los cuales se les denomina de raz6n fija y programas de razén variable, y los que toman en cuenta la cantidad de tiempo que transcurre antes de que se proporcione el reforzamiento, denominados programas de intervalo fijo y programas de intervalo variable. Programas de razén fijay variable En un programa de razén fija el reforzador se presenta s6lo después de la realizacién de determinado niimero de respuestas. Por ejemplo, un pich6n puede recibir alimento des- pués de la décima ver. que picotee tna tecla; aqui, la raz6n seria de 1:10. De modo simi- Aprendizaje Programa de razén fia b. Programa de razén variable g s 3 z : i : Se progucen 4 z pequenas pausas | E a Gespues decada | 2 Las respuestas a respuesta ‘curren con una 5 asa alta y constante 2 3 é é Tiempo Tiempo ¢. Programa de intervalo fijo a. Programa de intervalo variable 3 He Isas Ie tipic g 3 ay pausas largas tipicas | 3 2| despues de cada z 3] respuesa 3 z z a i Cs racquets a 3 fs constant 2 3 é é Tiempo Tiempo lar, alos costureros se les suele pagar con base en programas de raz6n fija: reciben x can- tidad de dinero por cada camisa que cosen. Debido a que mayor cantidad de produecién significa mayor reforzamiento, los empleados que laboran bajo un programa de raz6n fija Por lo general trabajan con la mayor rapidez. posible. Aun cuando ya no se ofrecen re- compensas, aparecen altos indices de respuestas agrupadas en “réfagas”, aunque las pau- sas entre ellas se espacian cada vez mas hasta que la respuesta desaparece por completo (véase figura 5.5). En un programa de raz6n variable el reforzamiento ocurre después de un nimero Variable de respuestas, ¥ no después de un mimero fijo. A pesar de que varia el nimero es- Pecifico de respuestas necesarias para que se reciba el reforzamiento, la cantidad de res- Duestas suele rondar un promedio especifico. Es posible que el mejor ejemplo de un Programa de raz6n variable sea el programa con que se encuentra la persona que realiza Yentas por teléfono. Puede que logre una venta en la tercera, octava, novena y vigésima lla- ‘mada que haga, sin haber tenido éxito en ninguna de las restantes. Aungue varia el niimero de respuestas que debe emitir antes de lograr una venta, su indice de éxito es 20%. En estas circunstancias se espera que el vendedor trate de hacer el mayor niimero de llamadas como pueda en el menor tiempo posible. Asf sucede en todos los programas de razén variable, los cuales promueven una tasa de respuestas alta y una gran resistencia a la extinciGn, Programas de intervalo fijo y variable: el paso del tiempo En contraste con los programas de razén fija y variable, en los que el factor crucial es el Inimero de respuestas, los programas de intervalo fijo y de intervalo variable se centran -en la cantidad de tiempo que transcurre desde que una persona 0 animal ha recibido un re- 205 FIGURA 5.5 Resultados tipicos de diferentes programas de reforzamiento. a. En un programa de raxén fija se producen pausas ccortas después de cada respuesta. Debido a que mientras més respuestas se emitan se obtendré ids reforzamiento, los programas de razén fija producen una tasa alta de respuestas. b. En un programa de razén variable también se Dobtiene una tasa alta de respuesta. ©. Un programa de intervalo fio prodiice tasas bajas de respuestas, ‘en especial justo después de que se ‘ha presentado el reforzamiento, en vista de que el organismo aprende ‘que debe transcurrir un periodo especifco entre reforzamientos. 4. Un programa de intervalo variable produce una cadena de respuestas constante. Programa de razén variable: programa en el que el reforzamiento ‘cure después de un nimero variable de espuestas, en lugar de un mero jo 206 Programa de intervalo fijo: programa qve proporciona ‘eforcamiento para una respuesta slo Sih transcurido un period fio, lo ue hace que las tasas generals de respuesta sean relaivamentebajas Programa de intervalo variable: programa enel que el tiempo entre ‘eforzamientos vara alrededor de alin promedio en lugar de ser jo Capitulo 5 | forzamiento. Un ejemplo de programa de intervalo fio es el salario semanal, Para las per sonas que reciben un salario semanal regular, en general poco importa lo que produzcan ‘en una semana determinada, siempre y cuando se presenten y trabajen algo. ‘Debido a que el programa de intervalo fijo proporciona un reforzamiento para tuna respuesta s6lo si ha transcurrido determinado periodo fijo, los indices generales de respuesta son relativamente bajos. Esto sucede en especial en el periodo inmediato poste rior al reforzamiento, cuando el tiempo por transcurrir antes del siguiente reforzamientg ¢s relativamente largo. Los hébitos de estudio de los alumnos ejemplifican esta realidad, Silos periodos entre los exmenes son relativamente largos (lo cual significa que Ia opor- tunidad de reforzar el buen aprovechamiento es poco frecuente), los estudiantes suelen estudiar poco o nada en absoluto, hasta que se aproxima el dfa del examen. Sin embargo, jjusto antes del examen, los estudiantes comienzan a estudiar con ahinco exhibiendo un répido incremento en su indice de respuesta de estudio (Mawhinney et al., 1971). Como es de esperarse, inmediatamente después del examen se produce una répida disminucién del indice de respuesta, debido a que son pocos los alumnos que abren un libro al dia si- guiente del examen. ‘Una manera de disminuir la demora en la respuesta que se produce después de apli- car el reforzamiento, y de mantener el comportamiento deseado en forma més consistente ‘lo largo del intervalo, es la utilizacién de un programa de intervalo variable, en el ‘cual el tiempo transcurrido entre los reforzamientos varia alrededor de un promedio de- temminado en lugar de ser fijo. Por ejemplo, un profesor que aplica exdmenes sorpress que varian de uno cada tes dias a uno cada tres semanas, aplicando en promedio un ext: ‘men cada dos semanas, esté utilizando un programa de intervalo variable. Comparado con los hébitos de estudio que observamos en el programa de intervalo fijo, es muy pro- bable que los habitos de estudio de Jos alumnos bajo un programa de intervalo variable ‘como éste serfan muy distintos. Los estudiantes se dedicarén al estudio con mayor regula- ridad puesto que no saben cudndo se realizaré el siguiente examen sorpresa. En general, los programas de intervalo variable tienen més posibilidades de producir indices de res- puestas relativamente més estables que las producidas por los programas de intervalo fijo, ‘ala vez que sus respuestas tardan més en extinguirse después de que cesa la administra- cin del reforzamiento. Discriminacién y generalizacién en el condicionamiento operante Un nifo no emplea mucho tiempo en aprender que una luz roja en wn cruce de calles sig- nifica “alto”, en tanto que una luz verde indica que esté permitido seguir caminando. Ast ‘al igual que con el condicionamiento clisico, el aprendizaje operante implica los fenéme- nos de la discriminaci6n y la generalizaciGn. El proceso mediante el cual las personas aprenden a distinguir estimulos se conoce como entrenamiento de control de estimulos. En el entrenamiento de control de estimulos se refuerza un comportamiento en presencia de un estimulo especifico, pero no en su au sencia, Por ejemplo, una de las discriminaciones més dificiles a las que se enfrentan las personas consiste en determinar en qué momento ta amistad de alguien no es s6lo amis- tad, sino el indicio de un interés roméntico. La gente aprende a hacer esa discriminacién ‘mediante la observacién de la presencia de diversas y sutiles claves no verbales, como ut ‘aumento del contacto ocular y un contacto corporal més frecuente, que indican un interés roméntico, Cuando dichas claves estan ausentes, las personas saben que no existe dicho {interés romdntico. En este caso, las claves no verbales actéan como estimulos diserimins- tivos, a los que el organismo aprende a responder durante el entrenamiento de control de estimulos. Un estémulo discriminativo sefiala la probabilidad de que una respuesta sea s¢- {guida por un reforzamiento. Por ejemplo, si espera hasta que su compafiero de cuarto esté de buen humor antes de pedirle prestado su disco compacto preferido, se puede decir que su comportamiento acta bajo el control de estimulos debido a que puede discriminar em" tre sus estados de [ — ‘Al igual que en el condicionamiento clisico, el fenémeno de la generalizacién de cstimulos, en el que un organismo aprende a responder a un estimulo y luego aplica esa respuesta a otros estimulos, también se encuentra en el condicionamiento operante. Si ha comprobado que ser amable produce el reforzamiento de conseguir su propésito en deter- nninada situacidn, es probable que generalice su respuesta a otras situaciones. No obstan- tr, algunas veces Ia generalizacién puede tener consecuencias desafortunadas, como | gando las personas se comportan de manera negativa frente a todos los miembros de un ‘grupo racial porque tuvieron una experiencia adversa con alguien de ese grupo. Conducta supersticiosa + Ena Universidad de Illinois, los estudiantes que presentan exémenes en el audito- rio de Ia sala Lincoln primero frotan la nariz de un busto de Lincoln para tener bue- na suerte, + En dias de examenes, los estudiantes de la Universidad de Miami evitan caminar sobre un escudo de metal de la escuela que estd incrustado en la acera. ‘+ Unestudiante del Albright College en Reading, Pennsylvania, asistia a un curso de {ntroduccién a la psicologfa en un sal6n que estaba parcialmente bajo el nivel del suelo. Siempre que habfa un examen, entraba en el sal6n por una ventana (Vyse, 1994). Aunque es fécil burlarse de estos rituales, los psic6logos del aprendizaje los consi- eran ejemplos de una clase interesante de respuestas Hamada conducta supersticiosa. Dicho comportamiento puede ser explicado en funcién de los principios basicos del refor- zamiento (Zimmer, 1984; Justice y Looney, 1990; White y Liu, 1995). Como se ha ex- | puesto, el comportamiento seguido de un reforzador tiende a fortalecerse. No obstante, en | ceasiones, el comportamiento que se manifiesta antes del reforzador es totalmente coinci- La Conducta suprstciosa, co <éente, Imagine, por ejemplo, que un jugador de béisbol golpea el suelo tres veces segui- jendiguras en la acera, puede ser el dss con su bate y después logra conectar un cuadrangular. Por supuesto que el batazo es resultado de un reforcamiento que una coincidencia con respecto a que el bateador haya golpeado tres veces el suelo, pero acurre de manera coincident «en lo que toca al jugador, esto puede parecer un evento relacionado. Debido a que el juga- dor hace esta asociacién, empieza a golpear tres veces el suelo cada vez. que se presente a batear en el futuro, y debido a que por lo menos recibir un reforzamiento parcial por su comportamiento (los bateadores suelen conectar un hit 25% de las veces que batean) es posible que se mantenga su comportamiento de golpear el suelo. {Las supersticiones afectan el comportamiento posterior? Es evidente que sf. De aeverdo con algunos psicélogos, Ia conducta supersticiosa permite a las personas afrontar <> - La conducta supersticiosa, como 1s ansiedad, ofreciéndoles rutinas o rituales que les pueden hacer sentir que controlan la suacién en que se encuentran. De esta forma, tocar la nariz de una estatua puede ayudar ‘tranquilizar a una persona, lo que, de hecho, puede llevarla a lograr un mejor desempe- fo cuando contesta un examen 0 durante una entrevista que le produce tensién. En este lo, nuestras supersticiones sf pueden moldear nuestro comportamiento posterior (Van Ginkel, 1990; Matute, 1994, 1995). Moldeamiento: el reforzamiento de lo que no ocurre en forma natural Piense en la dificultad que implica el empleo del condicionamiento operante para ensefiar ‘las personas a reparar la transmisién de un automévil. Si se tuviera que esperar hasta je la repararan a la perfeccién antes de ofrecerles un reforzamiento, el Modelo T volve- rita estar de moda mucho antes de que lograran dominar ese proceso. Existen muchos comportamientos complejos, que van desde la reparacién de auto- ‘Gviles hasta tocar la cftara, cuya ocurrencia natural no esperariamos como parte del cemportamiento esponténeo de cualquiera de nosotros. En estos casos, en los que de otro [todo no habria ocasién de ofrecer reforzamiento para un comportamiento determinado 208, Capitulo 5 Lynne Calero ‘Dolphin Research Center Grassy Key, Florida ee EducaciOn: B.A. en psicologia, Univer- sidad George Washington etic Be “Mghas personas han lefdo acerca de las jposibles conexiones entre los delfines y Jos humanas desde los puntos de vista del omportamiento y del intelecto, pero por ‘més de una década Lynne Calero ha visto estas semejanzas muy de cerca. En la actualidad directora médica {del Dolphin Research Center en Grassy ‘Key, Florida, Calero tuvo su acereamiento bésico a la psicologia como estudiante de pregrado en la Universidad George Was- hington, Washington, D.C. "Nuestra insti- tucién es un.centro de educacién e inyestigacién en el que oftecemos entre- rhamiento para éducar al poblico, al igual que Supervisamos la salud de los animales ide manera individual’, dice ella. "ALentrenar delfines, Calero usa los prineipios basicos del aprendizaje. “El ‘fandamento completo del-entrenamiento, {ue se hace con los delfines y leones mari: ‘hos se basa en él condicionamiento ope- “fante y ef el reforzamiento positive’ sefialas SEG ‘Por ejemplo, un tipo especifis de en- trenamento implica una sere de pasos pa. ra conseguir que Jos delfines aprendan a _preseia las aletas caudal, permitiendo, por consiguiente, que se tealicen prochas Idieas que requicren muesiras de sangre “Todos los animales aprenden primero los fundamentos, como responder ante un si- bato, Este se vuelve luego un reforzador secundario que es asociado con la alimen- tacidn, con darles atencii 0 con fotarles ellomo.” “A partir de ahi logtamos en forma gradual que se cologuen junto al mucle”, explica ella; seguido por una serie de a es, como en el enitenamien- to de cualquier comportaniento. Con cada paso nos acereamos cada vez més alas lets caudales hasta que el delfin nos per- nite sostenemos de ellas por encima de la superficie del aa”. ‘Los delfnes mis j6venes on mds fi Jes de entrenar,y se reqiere solo un mes de nitenamiento antes de gue presenten sus falta, Para Calero, ése'es un ejemplo dela {ntelgencia insitads de 10s delfines. “Por supuesto que su anafoinis cerebral es muy compleia. En general, mi impresin es que Jos defines son ncrefblementeincigentes, al igual que oy fatutvosysabis. (puesto que por principio de cuentas no ocurre), se utiliza un procedimiento al que se de- nomina moldcamiento. El moldeamiento es el proceso de ensefianza de un comporte ‘miento complejo mediante la recompensa ante aproximaciones cada vez més cercanas a comportamiento deseado. En el moldeamiento, cualquier comportamiento que sea silat al que se desea que aprenda el sujeto al principio obtiene reforzamiento. Después se re fuerzan s6lo las respuestas mas cercanas al comportamicnto que se desea ensefiar. Alf nal, sélo se refuerza la respuesta deseada. En este sentido, cada uno de los pasos del ‘moldeamiento va un poco mas allé del comportamiento previamente aprendido, lo que permite a la persona que relacione el nuevo paso con el comportamiento eprendido con anterioridad. El moldeamiento permite incluso a los animales inferiores el aprendizaje de respues- tas complejas que nunca ocurrirfan de forma natural; respuestas que van desde leones qv aprenden a saltar através de aros hasta delfines entrenados para rescatar a Jos buzos que s° han perdido en el océano. Asimismo, el moldeamiento subyace al aprendizaje de diversts habilidades humanas complejas. Por ejemplo, la organizacién de la mayorta de los libros de texto se basa en los principios del moldeamiento. Por lo comin, la informaciGn se pre- senta de manera que el nuevo material se apoya en conceptos 0 habilidades aprendidos con anterioridad. Por ello, el concepto del moldeamiento no podia haber sido presentado en este capitulo sino hasta después de haber comentado los principios ms bésicos del ‘aprendizaje operante. (Para una exposicin més amplia de las aplicaciones de los enfoques psicol6gicos al aprendizaje, véase Los caminos de la psicologia de este capitulo.) ‘Moldeamiento: proceso de censefianza de un comportamiento ‘complejo por medio de recompensas ant aproximaciones sucesivas dl ‘omportamiento deseado Aprendizaje Restricciones bioldgicas del aprendizaje: aun perro viejo no se le puede ensefiar cualquier truco Keller y Marian Breland estaban satisfechos con su idea: en su calidad de asesores de adiestradores profesionales de animales, se les ocurrié que un cerdo colocara un disco de madera dentro de una alcanefa de cochinito. Debido a su experiencia para adiestrar anima- les mediante el condicionamiento operante, pensaron que seria fécil ensefiar esa tarea, puesto que estaba incluida dentro de las capacidades fisicas del cerdo. Cada vez que trata ban de realizar el procedimiento, sin embargo, resultaba un fracaso. Al ver el disco, los cerdos no hacfan otra cosa que arrastrarlo por el suelo. Parecfa que Ios animales estaban programadbos biol6gicamente para arrastrar sobre el suelo los estimulos con forma de disco. Su fracaso con tos cerdos condujo a los Breland a sustituirlos por un mapache. A pesar de que el procedimiento funcion6 bien con un disco, cuando se le presentaron dos 4iscos el mapache se reltus6 a depositarlos en Ia alcancia y, en lugar de ello, los frotaba entre sf, como si los estuviera lavando. Una vez més, al parecer los discos provocaban el surgimiento de comportamientos biol6gicamente innatos que era imposible sustituir in- cluso mediante adiestramiento muy exhaustivo (Breland y Breland, 1961). Estas dficultades de tos Breland ilustran un aspecto importante: no se puede ense- ‘iar todo tipo de comportamientos a todas las especies y obtener resultados igualmente buenos. En lugar de ello, existen restricciones bioldgicas, es decir, limitaciones estructu- rales en la capacidad de los animales para aprender comportamientos especificos. En al- jgunos casos, el organismo tiene una inclinacién especial que favorece el aprendizaje de sierto comportamiento (como el de las palomas al dar picotazos); en otros casos, las res- tricciones biol6gicas se activarén para evitar o impedir que un organismo logre aprender determinado comportamiento. En cualquier caso, es evidente que los animales poseen mecanismos especializados de aprendizaje que influyen en la facilidad con la que funci aarén tanto el condicionamiento clésico como el operante, debido a que cada especie est inelinada biolégicamente para desarrollar tipos particulares de asociaciones y para encon- trar obstéculos al tratar de aprender otras (Hollis, 1984) 209 La insiruccién mediante ‘computadoras se funddamenta en los rincipios del moldeamiento, en los ‘cuales los aprendices son llevados a roporcionar aproximaciones cada vez mds cercanas al comportamienio deseado. [Recapitulacién, revision y reflexion Recapitulacién * Elcondicionamiento operante es un tipo de aprendizaje en el (que se fortalece o debilita una respuesta voluntaria,segin si Sus consecuencias son positivas o negativas. + _Elteforzamiento es el proceso por el cual un estimulo inere- menta la probabilidad de que se repita una conducta prece- dente Un reforzador positivo es un estimulo que se aftade al entor- no para aumentar la probabilidad de que ocurra una respues- ‘a. Un reforzador negativo es un estimulo que elimina algo ddesagradable del ambiente, lo que conduce a un aumento de Ja probabilidad de que una respuesta precedente ocurriré en el futuro, El castigo implica la administracin de un estimulo desagra- able después de una respuesta, con lo que se trata de dismi- ‘uir o suprimir alg comportamiento; puede consistir tam- bign en la remocién de un reforzador positive, timulo; en el reforzamiento negativo, el propésito es aumen- tarun comportamiento deseable mediante la remociéa de un estimulo, Elreforzamiento no tiene que ser constante para que el com- pportamiento se aprenda y se mantenga; de hecho, los progra- ‘mas de reforzamiento parcial conducen a una mayor rei tencia ala extincién que los programas de reforzamiento continuo, La generalizaci6n, la discriminaci6n y el moldeamiento se ‘cuentan entre los fenémenos fundamentales del condiciona- miento operant. Revision 1 Econdicionamiento escribe el aprendizaje que tiene lugar como resultado del reforzamiento. 2. Una persona hambrienta encontraré que la comida es un re- * Enel castigo, el objetivo es disminvir osuprimir el compor- forzador ———__entanto qu niet de cen pesos tamiento indeseable mediante la administracin de un es- 210 Capitulo 5 43, Relacione el tipo de aprendizaje operante con su definii6n: 1. Se presenta un estimulo desagradable para reducir un ‘comportamiento. 2, Se remueve un estimulo desagradable para aumentar el ‘comportamiento. 3, Se presenta un estimulo placentero para incrementar un comportamient. 1, Reforzamiento positivo b. Reforzamiento negative © Castigo 4, Sandra tuvo un dia pesado; ademas, el ruido que hacfa su hijo no le permitia relajarse. Debido a que no deseaba regatiarlo, ‘Sandra bajé su tono de vor. Te dijo a su hijo con mucha se- riedad que se encontraba muy cansada y le gustaria que juga- ra sin hacer ruido durante una hora. Esta manera de abordar tl problema funcion6, Para Sandra, el cambio de comporta- ‘miento de su hijo a. Un reforzador positivo b. Un reforzador secundario ©. Uncastigo 4. Unreforzador negativo '5, Sandra estaba satisfecha, No habia quedado contenta consigo ‘misma la semana pasada, cuando le grit6 muy fuerte a su hi- jo. En aquella ocasién terminé con el ruido excesivo de su hi jo por medio de: ‘a. La remocién de un reforzador . Un castigo . Un reforzador negativo 4. Laextincién 6. Enon programa de reforzamiento_ el comporta- ‘mento se refuerza algunas veces, en tanfo que en un progr: ‘ma de reforzamiento el comportamiento se re- fuerza todo el tiempo. 77. Relacione el tipo de programa de reforzamiento con su defi- 1. Elreforzamicnto se aplica después de un periodo determ- nado. 2, Blreforzamiento se da después de un determinado niime. ro de respuestas. 3, Blreforzamiento se ofrece después de un periodo varis- ble. El reforzamiento se proporciona después de un nimero variable de respuesta. a. De razin fija ». De intervalo variable c. De intervalo fijo 4. Deraz6n variable 8. Los programas de reforzamiento fio producen mayor resis- tencia ala extincin que los programas de reforzamiento va- rable. ;Verdadero 0 falso? Las respuestas a las preguntas de revisin se encuentran en la péigina 212 Reflexién 1. BLE. Skinner erefa que toda la vida de un sujto se poode es acura conorme a pincipios de conicionamiento opera terre que sea posbl? ;Que Benficis y qué problemas poora generat? 2. {Bloondiconamiento operant puede vase para sbordar i Joupaciones personals seria, como el abaguismo los Pinte de llmentacdn poco sans? Puede ustse para entge problemas soctle, como la Contaminacion ambien Maat enc? ,Con qué ip de problema iene una ms Yor probablidad de éxito? ;Por qué? 3, Como podita “cura Ia conduct superstcioss, como Ios sees cue ealizan ls personas antes de presentareximenes te patspar en competencias acs? (Es importante Cfectar i exincin de cchos comportamientos? ENFOQUES COGNITIVO-SOCIALES DEL APRENDIZAJE D> ;Oual es el papel dela cognicion {el pensamiento en el aprendi- Imaginemos lo que sucede cuando las personas aprenden a conducir un autom6vil. No se ‘colocan detrés del volante y vacilan por todo el tablero hasta que al azar colocan fa lave rajet tn el encendido y, més tarde, después de muchos arranques en falso, por aecidente logran > Cuales son algunos métodos précticos para producir un cam- bio en el comportamiento, tan~ ton nosotros como enlosde- mist que el automévil se muev: positivo. En lugar de ello, cia anterior como pasajeros, pedal del acelerador para. Es evidente que no ‘a hacia delante, recibiendo, por consiguiente, un reforzamiento ‘ya conocen los elementos basicos de conducir por su experi durante la cual con toda probabilidad notaron cémo era colo cada la llave en el encendido, de qué forma se ponia la velocidad y cémo se oprimia ‘que el automévil avanzara. ‘odo el aprendizaje se debe al condicionamiento clisico y ope ante. De hecho, casos como aprender a conducir un automévil imptican que algunos tipas {e aprendizaje se lleven a cabo por medio de procesos de orden superior, en los cules WS pensamientosy recverdos de las personas y la forma en que procesan Ia informaci6n exp Gan sus respuestas. Estas situaciones contradicen Ia perspectiva que considera al apreny

También podría gustarte