Está en la página 1de 14

Análisis funcional 1

LECCION 1:
Nociones básicas sobre
psicología del aprendizaje y
modificación de conducta

Montserrat Montaño
Daniel Peña
Pei-Chun Shih
detalle las características y propiedades de ambas formas de

E
aprendizaje.
l texto que se presenta a continuación no pretende,
en modo alguno, sustituir a los extraordinarios  Habituación. La habituación se refiere a la disminución
manuales existentes en nuestro país y fuera de temporal y reversible de una respuesta por la
nuestras fronteras sobre aprendizaje y/o terapia y presentación repetida del estímulo que la desencadena.
modificación de conducta, si bien consideramos de interés La habituación es mayor cuanto menos intenso sea el
recoger algunas de las nociones básicas habitualmente estímulo que se repite y mayor sea la frecuencia con la
presentadas en dichas fuentes para facilitar al lector su que éste se presenta. Puede haber recuperación
consulta y el acceso a ellas. Se ha decidido omitir de nuestro espontánea de la respuesta tras un periodo en el que el
discurso la introducción de citas referidas a las obras y estímulo desencadenante no se ha presentado.
autores consultados para la elaboración del mismo con el Frecuentemente, la presentación de estímulos algo
objetivo de agilizar la comprensión de los conceptos que en diferentes a los empleados en el proceso de habituación
él se exponen. En cualquier caso, al final del documento se da lugar a una recuperación de la respuesta o
recoge una relación completa de los trabajos que han servido deshabituación. Es importante no confundir este proceso
de referencia para el desarrollo del texto aquí presentado. con otros que también implican una reducción de la
respuesta pero no aprendizaje (por ejemplo, saciación,
adaptación sensorial o fatiga muscular).

1.1. Aprendizaje no asociativo  Sensibilización. La sensibilización consiste en el


aumento de la respuesta a un estímulo correlativa a la
Las dos formas de aprendizaje más elemental son la
presentación repetida de éste. La sensibilización, a
habituación y la sensibilización. Se consideran genuinamente
diferencia de la habituación, es directamente
aprendizaje porque implican un cambio estable en el
proporcional a la intensidad del estímulo. En muchos
comportamiento debido a la experiencia aunque no conlleven
casos la sensibilización ocurre a corto plazo para dejar
ningún proceso asociativo. Comentemos con algo más de
2 Nociones básicas sobre aprendizaje

paso, posteriormente, a la habituación. Un mismo En los casos en los que el condicionamiento emplee EIs que
estímulo puede provocar, en algunos casos, tanto naturalmente susciten respuestas de acercamiento (por
sensibilización como habituación dependiendo, ejemplo, comida), decimos que nos encontramos ante un
fundamentalmente, de cuál sea su intensidad. condicionamiento apetitivo. Cuando los EIs de forma natural
desencadenan respuestas de huida, defensa o evitación, el
condicionamiento que se produce se denomina
condicionamiento aversivo. Por otra parte, los estímulos
1.2. Paradigma del condicionamiento
neutros pueden asociarse a la no aparición del EI dando
clásico.
lugar a lo que se ha denominado condicionamiento
Si a un estímulo neutro (EN) le sigue muy de cerca en inhibitorio. En cambio, cuando un EN se asocia a la aparición
el tiempo un estímulo incondicionado (EI) que elicita una de un EI, decimos que nos encontramos ante un proceso de
respuesta incondicionada (RI), entonces el estímulo neutro condicionamiento excitatorio. Los EC en los

previo, ahora denominado estímulo condicionado (EC) condicionamientos inhibitorios se suelen representar con las

tenderá a elicitar una respuesta similar en el futuro que se siglas EC-, mientras que los EC de los condicionamientos

denominará respuesta condicionada (RC). Tratemos de excitatorios se representan EC+. Nótese que los signos
representar este fenómeno en un esquema y con el siguiente positivos no señalan el valor apetitivo o aversivo del EI sino la
ejemplo: presencia o ausencia del mismo.

EI RI Veamos a continuación algunos términos relevantes dentro


Pesadilla Nerviosismo, activación. del paradigma de condicionamiento clásico o respondiente.

EN EI
Estar en la cama solo de noche Pesadilla 1.2.1. Extinción
con la luz apagada
En el condicionamiento clásico hablamos de extinción
EC RC
cuando se produce un decremento de la RC por efecto de la
Estar en la cama solo de noche Miedo
presentación repetida del EC sin que vaya acompañado del
con la luz apagada
EI.

Entre los factores que influyen en el condicionamiento clásico o 1.2.2. Inhibición recíproca
respondiente podemos destacar los siguientes:
Si una RC, por ejemplo de relajación, que inhibe a otra RC,
 Cuanto mayor es el número de emparejamientos entre el por ejemplo de ansiedad, ocurre en presencia de los ECs que
EN y el EI, mayor es la capacidad del EC para elicitar la elicitan esta segunda RC de ansiedad, debilitará el vínculo
RC. existente entre estos ECs y la RC de ansiedad.
 El condicionamiento es más fuerte si el EC precede al EI
en unos segundos tan sólo. 1.2.3. Contracondicionamiento
 Un EC adquiere una capacidad mayor para elicitar una
Se considera contracondicionamiento a cualquier
RC si se empareja siempre con un EI determinado que
procedimiento de condicionamiento clásico en el que se
cuando se empareja con él sólo ocasionalmente.
emplea como EC un estímulo que previamente tiene para el
 Cuando varios estímulos neutros preceden a un EI, el
organismo un signo motivacional opuesto. Es decir, se trata
estímulo asociado con mayor consistencia al EI es el que
de utilizar un EC elicitador de una RC apetitiva como EC en
probablemente llegará a ser el EC más potente.
Análisis funcional 3

una nueva adquisición en la que se asocia a un EI aversivo, o 1.2.8. Precondicionamiento sensorial


a la inversa.
El precondicionamiento sensorial consiste en la asociación

1.2.4. Incubación previa de dos ENs de modo que cuando el segundo de ellos
se condiciona (se asocia con el EI dando lugar a una RC), el
El término incubación fue propuesto por Eysenck para otro también lo hace. Es importante no confundir el
referirse al fortalecimiento de la RC en condiciones en las precondicionamiento sensorial con la generalización (los
que el EC se presenta en ausencia del EI. Esta formulación estímulos pueden ser completamente diferentes).
pretende reelaborar la ley de la extinción según la cual la
presentación sistemática del EC sin que vaya acompañado
del EI llevaría a la extinción de la RC. Sin embargo, se ha
1.3. Paradigma del condicionamiento
visto que, en determinadas condiciones, esta ausencia de
emparejamiento EC-EI puede dar lugar a una intensificación
operante
de la RC en lugar de provocar su extinción. Estas
El condicionamiento operante es el proceso por el cual
condiciones son la presentación breve del EC y/o un EI muy
la conducta cambia como resultado de las consecuencias
fuerte que da lugar a una RC de gran intensidad.
generadas en el ambiente. Hablamos de conducta operante
porque literalmente opera sobre el ambiente para producir
1.2.5. Inhibición latente
efectos y esos efectos, a su vez, pueden determinar la
La exposición a un estímulo antes de que éste haya sido frecuencia o intensidad del comportamiento.
emparejado con un EI reduce la posibilidad de condicionar
Veamos a continuación algunos de los conceptos más
dicho estímulo, es decir, reduce la asociabilidad del EC.
importantes dentro del paradigma del condicionamiento

1.2.6. Bloqueo operante o instrumental y algunas de sus implicaciones en el


ámbito de la modificación o terapia de conducta.
Cundo un EI se ha asociado a un determinado EC, resulta
muy difícil que pueda asociarse a un nuevo EC: el primer EC 1.3.1. Reforzamiento y castigo
bloquea al EI. Estas dificultades para asociar un EI con un
Las consecuencias de la conducta que aumentan su
EN también se observan si el EI se presenta repetidamente
frecuencia o intensidad se denominan reforzadores. Las
de forma aislada, es decir, sin asociarse a ningún EC,
configuraciones estimulares que siguen inmediatamente a
probablemente porque se produce cierto condicionamiento
una conducta y que disminuyen la probabilidad de repetición
entre la configuración de estímulos que conforman el
de la misma se denominan castigos. Tanto los reforzadores
contexto y el EI (bloqueo contextual).
como los castigos pueden ser positivos o negativos. Así,
llamamos refuerzo positivo al evento que, cuando se
1.2.7. Irrelevancia aprendida
presenta inmediatamente después de una conducta, hace
Cuando un individuo se expone previamente a un EN y un EI que ésta suceda con más frecuencia o aumente la
sin que éstos aparezcan emparejados, se observa un retraso probabilidad de que ocurra en una situación similar.
en la adquisición de la respuesta condicionada cuando se Denominamos, en cambio, refuerzo negativo a aquella
tratan de asociar ambos estímulos: el organismo aprende configuración estimular que cuando se reduce, elimina o no
que no hay una relación entre el EC y el EI. aparece tras el comportamiento, hace que la probabilidad de
ocurrencia del mismo aumente en una situación futura
parecida. El castigo positivo, por su parte, se refiere al evento
4 Nociones básicas sobre aprendizaje

que al presentarse tras la emisión de una respuesta, disminuye refuerzo negativo. Así mismo, estímulos aparentemente
la probabilidad de ocurrencia de la misma en un futuro. Por agradables pueden estar actuando como castigos positivos
último, el castigo negativo hace alusión a aquella configuración mientras que la reducción de ciertos estímulos supuestamente
estimular que cuando se reduce, elimina o no aparece tras la desagradables puede funcionar como castigo negativo. El
aparición de la respuesta provoca una disminución de la “signo” del refuerzo o del castigo, por tanto, no se refiere a lo
probabilidad de ocurrencia de la misma en situaciones agradable o desagradable de la consecuencia sino al hecho de
similares. que ésta consista en la aparición de un evento (“signo”
positivo) o en la reducción, eliminación o no aparición del
La categorización de las consecuencias nada tiene que ver con
mismo (“signo” negativo).
el valor aparente de las mismas sino con el efecto que
producen sobre el comportamiento. De hecho, estímulos Veamos ahora un esquema aclaratorio general antes de
aparentemente dolorosos pueden ser en la práctica proceder a comentar de forma particular algunos de los
reforzadores positivos, mientras que la reducción de ciertos aspectos más relevantes de los procesos de reforzamiento y
estímulos aparentemente agradables puede actuar como castigo (ver tabla 1).

Tabla 1: Tipos de contingencias

Presencia del estímulo

Reducción/Eliminación
Aparición
No aparición
Refuerzo positivo Refuerzo negativo

Ej.: La atención de la madre en forma de Ej.: La eliminación de los intentos del niño
Aumenta “regañina” que sigue a la conducta del de abrazar y jugar con su padre que sigue a
niño de saltar sobre el sillón mientras la la conducta de éste de poner la televisión
madre da de comer al hermano. mientras prepara la comida del niño.
Efecto
sobre la Castigo positivo
Castigo negativo
conducta
Ej.: Los besos y el uso de palabras
Ej.: Salir de la clase de los “castigados”
Disminuye cariñosas de la madre cuando el
donde la adolescente se sienta junto al
adolescente se encuentra con ella
chico que le gusta tras haber acabado la
mientras sale con sus amigos a
tarea pendiente.
divertirse.

1.3.1.1. Reforzamiento reforzante implica analizar cómo influye su aplicación


sobre la conducta ya que un evento se define como
Algunos de los aspectos fundamentales a tener en cuenta
reforzador únicamente a partir de sus efectos sobre el
respecto al reforzamiento son los siguientes:
comportamiento al que sigue.
 Idiosincrasia. Aquello que puede resultar reforzante para
 Magnitud. Normalmente, cuanto mayor sea el estímulo
un individuo concreto puede no serlo para otro de modo
reforzante, más potente será su efecto sobre la conducta
que se hace imprescindible identificar el reforzador eficaz
si bien esto depende del grado de privación o saciación al
en cada caso. Comprobar si algo resulta realmente
Análisis funcional 5

que se haya visto expuesto el individuo antes de recibir el helado que pedía, mientras que esta conducta materna
refuerzo. está siendo reforzada negativamente por el cese de la
rabieta del niño).
 Contingencia. Si se pretende maximizar la eficacia de un
programa de reforzamiento, es necesario asegurarse de a.3.1.2. Refuerzo intermitente
que los reforzadores sean contingentes a las conductas
específicas que se quieren mejorar. Cuando hablamos de un programa de refuerzo nos estamos
refiriendo a la regla que especifica qué incidencias de una
 Demora. El refuerzo más eficaz es aquel que se da conducta dada se refuerza. Podemos encontrar programas
inmediatamente después de que ocurra la conducta. Los de refuerzo continuo, donde cada conducta es reforzada;
reforzadores diferidos pueden tener efecto sobre el programas de extinción, en los que no se refuerza ninguna
comportamiento gracias a las instrucciones y las conducta; o programas de refuerzo intermitente, que es un
autoafirmaciones que intervienen entre éstos y la caso intermedio ya que en él el comportamiento se refuerza
conducta manifestada. pero sólo en algunas ocasiones. Las ventajas que presenta el

 Explicitación. Para que un reforzador sea eficaz no es programa intermitente frente al de refuerzo continuo son:

necesario que el individuo entienda por qué ha sido  La saciedad es menor de modo que el refuerzo mantiene
reforzado, si bien el uso de normas o instrucciones puede su eficacia durante más tiempo.
resultar de gran ayuda.
 La extinción es más lenta (ver lo que se menciona a
 Principio de Premack. Una conducta que ocurre con propósito de la extinción en el apartado 1.3.2.)
mucha frecuencia puede ser usada de forma contingente
a otra que ocurre rara vez para reforzarla, de ahí que  El individuo trabaja con mayor consistencia.

resulte recomendable observar las actividades que con


 La conducta persiste más fácilmente cuando se
mayor frecuencia realiza el individuo.
transfiere al entorno natural.

 Condicionamiento de escape y evitación. La aplicación


Veamos ahora los tipos de programas de reforzamiento
sistemática de reforzadores negativos se conoce como
intermitente más comunes:
condicionamiento de evitación (se “previene” la aparición
de la estimulación típicamente aversiva) o
a) Programas de razón:
condicionamiento de escape (sólo se puede interrumpir
dicha estimulación una vez se ha presentado). A menudo  Programas de razón fija (RF). El refuerzo aparece
el individuo primero aprende a escapar del estímulo cada vez que se emite un número determinado de
desagradable para, posteriormente, llegar a evitarlo. respuestas (por ejemplo, cobrar por cada 10 sobres
entregados en un servicio de mensajería). El
 Combinación de reforzamiento positivo y negativo.
incremento excesivamente rápido de un programa
Numerosos problemas de conducta implican la influencia
de RF (en nuestro ejemplo, pasar a cobrar sólo si se
combinada de reforzadores positivos y negativos (por
entregan 100 sobres) puede dar lugar a un deterioro
ejemplo, el consumo de drogas). Por otra parte, hay
de la respuesta (tensión de razón). Este tipo de
situaciones donde el reforzamiento se da de un modo
programas produce una frecuencia de conducta
recíproco apareciendo los dos tipos de refuerzos (por
altamente estable hasta que aparece el refuerzo;
ejemplo, la pataleta de un niño se ve reforzada
tras éste, se observa una pausa de respuesta cuya
positivamente por la madre que le compra finalmente el
6 Nociones básicas sobre aprendizaje

duración dependerá del valor de la razón (a mayor Esquema ilustrativo del funcionamiento de los programas de
valor, mayor es la pausa y la resistencia a la intervalo simple:
extinción de la conducta). Se refuerza la
primera respuesta
INTERVALO que se produzca
 Programas de razón variable (RV). El número de
respuestas requeridas para provocar la aparición del
Tiempo
reforzador cambia de un refuerzo a otro de forma no
Las respuestas que se produzcan no serán
predecible (por ejemplo, a veces la máquina
reforzadas
tragaperras da premio al introducir 1 moneda, otras
al introducir 20 y otras al introducir 53). También c) Programas de intervalo con margen limitado: tienen las
produce una alta frecuencia de respuesta pero no mismas características que los programas de intervalo
produce pausa postrefuerzo o ésta es muy pequeña. simple pero con el requisito añadido de que la respuesta,
Los programas de RV pueden incrementarse algo para ser reforzada, debe darse en un tiempo limitado
más abruptamente que los de RF sin producir después de que haya pasado el intervalo. Estos
tensión de razón y pueden mantener niveles algo programas producen efectos similares a los de los
más altos de respuesta y de resistencia a la programas de razón con la ventaja añadida de que no es
extinción que los programas de RF de igual valor (el necesario llevar la cuenta de las respuestas emitidas.
valor del programa de razón variable es la media
aritmética del número de conductas requeridas para Esquema ilustrativo del funcionamiento de los programas
provocar la aparición del reforzador). de intervalo con margen limitado:

b) Programas de intervalo simple: Se refuerza la


primera respuesta
INTERVALO que se produzca
 Programas de intervalo fijo (IF). Se refuerza la
primera respuesta después de que haya transcurrido
Tiempo
un periodo de tiempo fijo tras la última aparición del MARGEN
Las respuestas que se LIMITADO Las respuestas
refuerzo. Si suponemos que las personas que están
produzcan no serán reforzadas (Disponibilidad no serán
reforzadas según un programa de IF no saben la del refuerzo) reforzadas
hora, éste produce un nivel de respuesta que
aumenta gradualmente a lo largo del intervalo hasta
que aparece el reforzador, y también produce una d) Programas de duración: el refuerzo se presenta después
pausa postrefuerzo proporcional al valor del de que se haya dado la conducta durante un periodo de
intervalo. tiempo continuo. También podemos hablar de programas
de duración fija (DF) y variable (DV). Ambos producen
 Programas de intervalo variable (IV). La duración del
largos periodos de conducta continua aunque el DF
intervalo varía de un refuerzo al siguiente de forma
produce una pausa postrefuerzo que no se aprecia en los
no predecible. Este programa produce una
programas de DV.
moderada frecuencia de respuesta y no provoca
pausa postrefuerzo o ésta es muy pequeña.
Análisis funcional 7

Esquema ilustrativo del funcionamiento de los programas  Refuerzo diferencial de respuestas incompatibles: a la
de duración: hora de reforzar la ausencia de una conducta muchas
veces lo que hacemos es reforzar la incidencia de
INTERVALO
cualquier otra respuesta incompatible. También puede
Respuesta no reforzada ser conveniente el refuerzo diferencial de conductas
alternativas no necesariamente incompatibles (por
Respuesta reforzada al final del intervalo
ejemplo, reforzar al niño que habitualmente se levanta y
Tiempo
corre por la clase por permanecer sentado haciendo sus
deberes).
El refuerzo intermitente no sólo puede utilizarse para
incrementar la respuesta, sino que también puede emplearse a.3.1.3. Reforzadores condicionados
para disminuir el comportamiento:
Los reforzadores condicionados son estímulos que, por
 Refuerzo diferencial de tasas bajas: si sólo se da el naturaleza, no son reforzantes pero que adquieren este valor
refuerzo cuando la respuesta aparece con una tras asociarse con otros reforzadores denominados de
frecuencia baja, dicha respuesta tenderá a aparecer apoyo, ya sean éstos condicionados o no condicionados. Los
pocas veces. El refuerzo diferencial de tasas bajas reforzadores condicionados que pueden acumularse y
puede ser de respuesta limitada cuando sólo aparece el canjearse por reforzadores de apoyo se denominan fichas. El
refuerzo si el total de respuestas emitidas no supera un dinero, por ejemplo, o los elogios son ejemplos de
número específico en una sesión o intervalo (por reforzadores condicionados. Igualmente, un estímulo ligado a
ejemplo, el niño que se gana su tiempo de recreo si en un castigo deviene en algo punitivo por sí mismo pasando a
clase no habla con su compañero más de 3 veces); o de considerarse un castigo condicionado; de hecho, las fichas
respuesta espaciada, cuando la respuesta se refuerza punitivas son tan válidas como las reforzadoras. Los factores
sólo si se da transcurrido un intervalo y la emisión de la que influyen en la eficacia de los reforzadores condicionados
respuesta en dicho intervalo implica la reiniciación del son:
mismo (por ejemplo, si un niño sabe contestar
correctamente a las preguntas de la maestra pero eso  Potencia de los reforzadores de apoyo: cuanto más

priva a otros compañeros de la oportunidad de intervenir potentes sean éstos, más eficaz será el reforzador

en clase, se puede estipular que se refuerce la respuesta condicionado.

correcta a una pregunta de la profesora siempre que  Variedad de los reforzadores de apoyo: un estímulo
ésta ocurra al menos 15 minutos después de que el niño emparejado con distintos reforzadores de apoyo se
respondiera correctamente a una cuestión previa). considera un reforzador generalizado y es más eficaz

 Refuerzo diferencial de respuesta cero: implica el que aquel asociado a un único reforzador (Ej., las fichas

refuerzo de periodos cada vez mayores de no aparición o el dinero).

de la respuesta indeseada, es decir, se refuerza la no  Programa de emparejamiento con el reforzador de


ocurrencia de la conducta (por ejemplo, reforzar periodos apoyo: el reforzador condicionado es más eficaz si el
de tiempo cada vez mayores sin berrinches). reforzador de apoyo no se da cada vez que se otorga el
reforzador condicionado.
8 Nociones básicas sobre aprendizaje

 Extinción del refuerzo condicionado: dejar de asociar el frustración por lo que conviene combinar las técnicas
reforzador de apoyo con el reforzador condicionado hace aversivas con el reforzamiento de respuestas alternativas.
que éste pierda su eficacia.
 Combinación del castigo y el reforzamiento negativo. A

A veces se espera que los reproches sean punitivos por sí menudo el comportamiento castigado suele ser sustituido

mismos y no lo son porque no se han asociado a un castigo de por una respuesta de evitación o escape que elimina la

apoyo, de modo que pueden resultar incluso reforzadores estimulación aversiva.

condicionados si se asocian a estímulos reforzantes como la


a.3.2. Extinción
atención.
El principio de extinción establece que, si en una situación
a.3.1.4. Castigo dada alguien emite una respuesta previamente reforzada y

El castigo es la forma más comúnmente utilizada para hacer ésta no es seguida por una consecuencia reforzante, se reduce

decrecer la frecuencia de una conducta. Un castigo sólo lo es la probabilidad de que esta persona se comporte del mismo

si debilita la respuesta que lo precede independientemente del modo en una situación similar. En cualquier caso, es necesario

valor aparente del estímulo. Veamos algunas de las que se den varios ensayos para que se produzca un efecto

características y aspectos a mencionar del castigo: claro.

 Tipos de estímulos punitivos. Dentro de los diversos tipos Los factores a tener en cuenta a la hora de analizar y aplicar el

de estímulos punitivos encontramos el castigo físico, las proceso de extinción son los siguientes:

reprimendas, el “tiempo fuera” y el “coste de respuesta”  Estallido de extinción. La conducta a extinguir puede
entre otros. incrementar antes de comenzar a disminuir, por eso es

 Intensidad. Si el castigo no es muy severo sólo logra la importante mantener la extinción una vez iniciada o se

supresión temporal de la respuesta ya que ésta tiende a corre el riesgo de reforzar una respuesta aún más

reaparecer cuando el castigador se va. molesta que la que se pretende reducir.

 Contingencia. Si se pretende maximizar la eficacia de un  Recuperación espontánea. La conducta extinguida puede

programa de castigo, es necesario asegurarse de que la reaparecer tras algún tiempo si bien puede volver a

estimulación punitiva sea contingente a la conducta lograrse tras algunos ensayos de extinción adicionales.

específica que se quiere eliminar y que se presente  Supresión de los reforzadores adecuados. Durante la
siempre que dicho comportamiento ocurra. extinción es fundamental asegurarse de que los

 Demora. El castigo es más efectivo si se aplica de forma reforzadores que se están eliminando son aquellos que

inmediata a la ocurrencia de la conducta que se desea realmente mantenían la conducta no deseada, así como

modificar. controlar que no haya otras fuentes que estén reforzando


el comportamiento que se pretende extinguir.
 Explicitación. Aunque el uso de reglas no es necesario
para que funcione la aplicación del castigo, puede ayudar  Refuerzo de conductas alternativas. La extinción alcanza

a aumentar la velocidad y eficacia del procedimiento. su mayor eficacia cuando se combina con el refuerzo de
algún comportamiento alternativo. Si el individuo es
 Consecuencias del castigo. Los procedimientos de sometido exclusivamente a la retirada del reforzador, es
castigo, especialmente aquellos que implican castigos
positivos, suelen dar lugar a respuestas agresivas y de
Análisis funcional 9

muy probable que experimente reacciones negativas flexible adaptando estas aproximaciones al ritmo del
como la frustración y/o la agresividad. sujeto.

 Resistencia a la extinción. La conducta mantenida por  Para progresar al ritmo adecuado es conveniente seguir

reforzamiento intermitente es más resistente a la extinción las siguientes pautas:

que aquella que ha sido reforzada de forma continua.


 Dividir la conducta en pasos concretos y suficiente,
 Explicitación. Aunque no es necesario que el sujeto aunque no innecesariamente, pequeños.

comprenda el proceso de extinción al que se le está  Es fundamental, al menos en un principio, reforzar


sometiendo para que éste tenga efecto, su conocimiento inmediatamente la respuesta deseada o se corre el
puede resultar útil para acelerar la reducción de la peligro de reforzar conductas intermedias entre la
respuesta no deseada. respuesta que se desea implantar y el refuerzo.
 No dar el siguiente paso hasta que la aproximación
a.3.3. Moldeamiento previa esté consolidada. De lo contrario, se corre el
riesgo de que ésta se pierda.
El moldeamiento implica el desarrollo de un nuevo
 Si se pierde una conducta por haber dado un paso
comportamiento mediante el refuerzo de aproximaciones
demasiado grande o haber ido demasiado deprisa,
sucesivas a esa conducta meta y la extinción de tales
retroceder a una aproximación anterior donde se
aproximaciones a medida que se va configurando el
pueda retomar la conducta a entrenar.
resultado final. Existen cuatro aspecto o dimensiones de la
 Es importante evitar reforzar excesivamente una
conducta que pueden moldearse: topografía, cantidad
aproximación puesto que ésta puede fortalecerse
(frecuencia y/o duración), latencia e intensidad. Aunque a lo
demasiado siendo más difícil que se den nuevos
largo de la vida de una persona ésta se somete (y somete a
pasos.
otros) a numerosos procesos de moldeamiento en su entorno
natural sin apenas percatarse de ello, desde un contexto  Si nos damos cuenta de que los pasos establecidos
resultan demasiado grandes, añadir aproximaciones
terapéutico podemos tener en cuenta algunos factores que
influyen en el moldeamiento de cara a programarlo del modo intermedias.

más eficaz posible:


a.3.4. Discriminación
 Es necesario especificar la conducta terminal deseada
Cuando una conducta se refuerza o castiga en presencia de
concretando las condiciones bajo las que la conducta
debería o no darse. un estímulo determinado y no de otro, este estímulo
comienza a ejercer control sobre la incidencia de dicha
 Para la elección del comportamiento inicial hay que tener
conducta pasando a denominarse estímulo discriminativo. Un
en cuenta el nivel en el que se encuentra el individuo ya
estímulo discriminativo, por tanto, es aquel estímulo que
que la conducta a elegir ha de darse lo suficiente como
señala que, si la conducta se emite en su presencia, las
para que aparezca y pueda reforzarse durante la sesión
consecuencias (reforzantes o punitivas) aparecerán con
de entrenamiento.
mayor probabilidad. El estímulo delta, por el contrario, es
 Es fundamental especificar los pasos sucesivos que aquel estímulo que se ha asociado con la no aparición de las
habrá de realizar el sujeto hasta llegar al consecuencias tras la emisión de la conducta, señala, por
comportamiento final deseado. Es muy importante ser tanto, que si el individuo actúa ante él, las consecuencias
aparecerán. Así, por ejemplo, un profesor encima de la
10 Nociones básicas sobre aprendizaje

tarima puede actuar como estímulo discriminativo señalando no confundir el moldeamiento con el desvanecimiento ya que el
que si el alumno emite la conducta “levantar la mano”, ésta va primero implica un cambio gradual de respuesta pero la
a verse reforzada por la consecuente atención del maestro. estimulación antecedente permanece inalterada, mientras que
Pensemos en cambio en un profesor ciego. En este caso, el en el segundo lo que se modifica es el estímulo pero no así la
profesor sobre la tarima será un estímulo delta que señala que respuesta.
la emisión de la conducta “levantar la mano” no va a ir seguida
El proceso de desvanecimiento implica seguir varios pasos:
por ninguna consecuencia. En cuanto al estímulo discriminativo
que señala la posible aparición de un castigo, pensemos en la a) Seleccionar el estímulo final que se desea que controle
presencia de un guardia de circulación junto a un semáforo en la conducta (es fundamental asegurar que la respuesta
rojo. Dicha configuración estimular sin duda es un estímulo se mantendrá en el entorno natural).
discriminativo que señala que si emitimos la conducta “pasar
b) Seleccionar el estímulo inicial. Es muy importante que
con el coche”, ésta va a ser castigada.
este estímulo provoque la conducta deseada (ejemplos:
El procedimiento mediante el cual aprendemos a emitir instigadores verbales, gesticulares, ambientales, guía
conductas apropiadas en presencia de ciertos estímulos y no física, etc.)
en la de otros, se denomina entrenamiento en discriminación
c) Seleccionar cuidadosamente los pasos para ir
del estímulo. Los factores que determinan la eficacia del
eliminando los instigadores. Hay que ajustar la velocidad
entrenamiento en discriminación del estímulo son:
del desvanecimiento al rendimiento del sujeto de modo
 Elección de las señales. Es deseable que los estímulos que no se avance ni demasiado rápido (de modo que se
discriminativos sean muy claros y no controlen otras pierda el control previamente desarrollado), ni
respuestas que interfieran con la emisión de la respuesta excesivamente despacio (de modo que el sujeto se
deseada. vuelva demasiado dependiente de los estímulos
intermedios).
 Posibilidades de error. Es importante minimizar las
posibilidades de que el individuo responda ante un
a.3.6. Encadenamiento
estímulo delta.
Las cadenas conductuales implican una serie consistente de
 Número de ensayos. Maximizar el número de ensayos
estímulos y respuestas en las que cada respuesta, excepto la
facilitará el aprendizaje.
última, es al mismo tiempo un refuerzo condicionado para la

 Descripción de las contingencias. Hacer uso de reglas respuesta previa y un estímulo discriminativo para la siguiente

que describan las contingencias, aunque no es respuesta (por ejemplo, cadena de conductas que realizamos

necesario, puede acelerar en gran medida el proceso de para vestirnos). Normalmente la última respuesta va seguida

entrenamiento. de un reforzador. Los métodos que permiten el aprendizaje de


estas cadenas E-R son:
a.3.5. Desvanecimiento
 Presentación de la tarea total. El sujeto intenta todos los
El desvanecimiento implica un cambio gradual de un estímulo pasos en cada ensayo hasta que los domina todos (por
que controla una respuesta a lo largo de ensayos sucesivos de ejemplo, el niño en cada ensayo se pone los calcetines,
modo que, al final, la respuesta se da tras un estímulo las zapatillas y las abrocha y recibe el reforzador al final
parcialmente distinto o totalmente nuevo. Es muy útil para de la cadena). Parece que es el método más ventajoso,
cambiar el control estimular de una respuesta. Es importante rápido y común.
Análisis funcional 11

 Encadenamiento hacia atrás. Se construye la cadena de generalización de las respuestas. Además, el cambio
forma gradual y en el orden inverso a la secuencia en la terapéutico de conducta debe mantenerse en el ambiente
que se realiza (por ejemplo, el niño primero ha de atarse natural, esto es, ha de generalizarse a través del tiempo.
los cordones para recibir el reforzador; posteriormente se Veamos algunos factores que ayudan a potenciar la
le exige que se ponga los zapatos y los abroche antes de generalización del cambio comportamental:
administrarle el refuerzo; finalmente debe realizar toda la
 Cuanto más parecidas sean las situaciones de
secuencia, esto es, ponerse los calcetines, calzarse las
entrenamiento a aquellas en las que se desea que se dé
zapatillas y atarse los cordones, para que el reforzador
la conducta entrenada, más probable es que haya
sea presentado).
generalización de estímulos. Lo ideal sería que el
 Encadenamiento hacia delante. Primero se enseña el entrenamiento se realizara en la propia situación meta.
paso inicial y luego los siguientes hasta aprender la También es útil que la situación de entrenamiento
cadena completa (por ejemplo, el proceso inverso al que implique que la respuesta se ponga bajo el control de
hemos mencionado: primero reforzar al niño por ponerse gran variedad de estímulos de modo que aumente la
los calcetines, luego por ponerse los calcetines y calzarse probabilidad de que alguno de esos estímulos se dé en
las zapatillas, y, finalmente, por ponerse los calcetines, el la situación natural. Otra estrategia implica programar
calzado y abrochárselo). estímulos comunes, es decir, que estén presentes tanto
en la situación de entrenamiento como en la situación
a.3.7. Generalización
natural; de gran utilidad resulta someter la conducta
Decimos que se produce generalización cuando la conducta deseada al control de reglas.
aprendida en una situación aparece también en otra
 En cuanto a la programación de la generalización de
diferente. Si no se diera este proceso, nuestro repertorio
respuesta, ésta puede potenciarse entrenando diferentes
conductual sería muy restringido puesto que tendríamos que
ejemplos de respuesta o variando deliberadamente las
adquirir una respuesta nueva ante cada situación. Cuanto
respuestas consideradas aceptables durante el
mayor sea la semejanza entre las características de los
entrenamiento.
estímulos de la situación nueva y aquella en la que fue
aprendida la respuesta originalmente, mayor es la  Por último, el mantenimiento de la conducta entrenada
probabilidad de que se produzca la generalización. En clínica depende, fundamentalmente, de que la conducta se siga
es fundamental que haya una generalización del tratamiento reforzando fuera de la situación de entrenamiento. Para
a las situaciones de la vida real del sujeto, por eso, el ello puede resulta útil entrenar aquellas respuestas que
terapeuta ha de estructurar sistemática y conscientemente la serán reforzadas con una gran probabilidad en el
situación terapéutica para que sea lo más parecida posible al ambiente natural, alterar las contingencias de
ambiente natural donde ocurre el problema del cliente. reforzamiento de la situación meta modificando la
conducta de otras personas, o dar el control al sujeto
Se dice que un entrenamiento produce generalidad cuando la
entrenándolo en autocontrol.
conducta entrenada se transfiere a un nuevo ambiente,
cuando el entrenamiento trata de promover una conducta que
no se ha entrenado específicamente, o cuando se mantiene
la conducta entrenada. Para ser eficaz, el cambio terapéutico
debe mostrar generalización del estímulo (de la situación de
entrenamiento al ambiente natural) y, en ocasiones,
12 Nociones básicas sobre aprendizaje

 La historia de refuerzo o castigo de la conducta de imitar


del individuo y la presencia de refuerzos, incentivos o
a.4. Aprendizaje vicario sanciones sociales si se repite la conducta observada.
Puesto que la historia de reforzamiento o castigo del
Las aplicaciones prácticas derivadas de la Teoría del
comportamiento de imitar es particular, los estímulos
Aprendizaje Social propuesta por Bandura parecen claras. Si
discriminativos que pueden hacer más probable que se
bien no es cierto que el entorno social haya sido obviado por
produzca imitación variarán de unos sujetos a otros.
otros teóricos del aprendizaje, sí parece justo afirmar que
 El modelado es más eficaz cuando se combina con
Bandura presta una atención especial al contexto interpersonal
normas y otras estrategias comportamentales.
para explicar la adquisición, mantenimiento y cambio
 Si el comportamiento que se va a adquirir es complejo, el
comportamental. En este sentido, no podemos dejar de
modelado debería fragmentarse.
destacar que gran parte de nuestro repertorio conductual se
 Las escenas de modelado deberían ser lo más realistas
forma mediante el reforzamiento de respuestas imitadas. Este
posible para favorecer la transferencia y generalización.
mecanismo de aprendizaje es de una gran importancia porque
nos permite incorporar largas y numerosas cadenas de
conductas mediante el simple procedimiento de observar a otra 1.5. Condicionamiento encubierto
persona cuando emite esas respuestas, es decir, sin necesitar
aprender todo directamente por ensayo y error. En la consideración de los fenómenos encubiertos hay
que distinguir dos líneas de investigación:
Entre los factores que pueden determinar que se imite a un
modelo hemos de mencionar: a) Aquella desarrollada por investigadores como Bandura,
Cautela, Homme, Stampfl o Levis, que conciben los
 Las consecuencias que siguen a la conducta del modelo
comportamientos encubiertos (pensamientos, emociones)
(si éste recibe o no refuerzo por la respuesta emitida).
como conductas enmarcables dentro de la teoría del
 Es más probable que se imite a: aprendizaje.

 Alguien similar al observador. b) Aquella desarrollada inicialmente por autores como


 Alguien con poder o prestigio para el observador. Davidson, Wilson, Lazarus, Mahoney o Meichenbaum,

 Alguien competente en la obtención de las que no se ocupan de este tipo de fenómenos desde la

consecuencias deseadas. teoría del aprendizaje sino desde una orientación


cognitiva.
 Si varias personas actúan como modelo, es más fácil
que ésta sea imitada. Las investigaciones enmarcadas dentro de la teoría del
aprendizaje se basan en el supuesto de homogeneidad: “los
 Es importante que el observador posea los componentes
fenómenos encubiertos obedecen a las mismas leyes que los
de la respuesta a imitar para que la lleve a cabo.
fenómenos observables” (aunque varíe el grado en el que son

 La oportunidad de que el observador practique la accesibles a un observador externo), y de interacción: “los

conducta inmediatamente después de observar al fenómenos encubiertos y los observables interactúan y se

modelo va a favorecer, así mismo, el aprendizaje vicario. influyen mutuamente”. Los terapeutas de conducta cognitiva,
aquellos señalados en el segundo grupo, no aceptan, por lo
 Presencia de refuerzos, incentivos o sanciones sociales general, el supuesto de homogeneidad aunque sí el efecto de
para el imitador (seguramente el factor más importante). interacción.
Análisis funcional 13

Los procedimientos operantes y del aprendizaje social que se  Coste de respuesta encubierto (CRE). Eliminación de un
consideran en el condicionamiento encubierto y que cuentan reforzador positivo imaginario contingente con una
con investigación que avalan su eficacia son: respuesta real o, más frecuentemente, imaginaria. Es
similar a la SE ya que en ambos casos se trata de
 Reforzamiento positivo encubierto (RPE). Técnica en la
procedimientos de condicionamiento aversivo utilizados
cual la persona se autorrefuerza imaginariamente tras la
para reducir la probabilidad de una respuesta. En la SE,
aparición de una conducta adecuada bien en la vida real
sin embargo, se añade a la escena un estímulo aversivo
o en imaginación. Se utiliza tanto con conductas de
mientras que en el CRE se elimina un estímulo positivo
aproximación como de evitación que el cliente desea
para el cliente. El empleo conjunto de CRE y SE puede
modificar.
prevenir la habituación a un estímulo aversivo.
 Reforzamiento negativo encubierto (RNE). La respuesta
 Modelado encubierto (ME). Aprendizaje de nuevas
que se pretende aumentar provoca el cese de un
conductas o modificación de comportamientos ya
estímulo aversivo; este cese tiene el efecto de
existentes mediante la observación imaginaria de
incrementar la conducta que lo provoca. Este
respuestas de otras personas y las consecuencias que
procedimiento se emplea como última alternativa cuando
de ellas se siguen. Puede utilizarse solo o combinado
el cliente no ha respondido positivamente a un
con otros procedimiento (por ejemplo, añadir el
procedimiento de RPE o de modelado encubierto. A la
reforzamiento encubierto al modelado encubierto parece
hora de elegir el estímulo aversivo que se va a utilizar es
aumentar su efectividad). Un modelo parecido al sujeto
necesario tener en cuenta que debe elicitar miedo, debe
se ha mostrado más efectivo así como el uso de varios
ser muy claro y ha de tratarse de un estímulo al que el
modelos diferentes en lugar de uno solo.
cliente pueda poner fin inmediatamente. Es posible que
el cliente llegue a habituarse al estímulo aversivo por lo
que el procedimiento podría perder su eficacia.
1.6. Conducta verbalmente gobernada
 Sensibilización encubierta (SE). Procedimiento por el
cual una consecuencia imaginaria altamente aversiva, Desde que Skinner diferenciara entre el
previamente evaluada por el cliente como ansiógena, se comportamiento moldeado por las contingencias y el
hace contingente con una conducta desadaptativa de comportamiento moldeado por reglas, se ha escrito e
aproximación. Este estímulo puede ser relevante o investigado mucho acerca de la conducta verbalmente
irrelevante al problema. Se suele combinar con el RNE y gobernada. Las reglas consistirían en descripciones de los
se corresponde con el proceso de castigo positivo en el tres términos de la contingencia de un reforzamiento (E-R-C).
condicionamiento de conductas manifiestas. Está claro que seguir reglas es un comportamiento altamente
adaptativo en la mayoría de los casos puesto que facilita y
 Extinción encubierta (EE). El cliente se imagina llevando
acelera el aprendizaje especialmente cuando las
a cabo la conducta problema concreta pero sin obtener
contingencias son complejas o están poco claras. Esto
ninguno de los reforzadores que normalmente le siguen.
explicaría, sin duda, que tendamos a formular reglas incluso
Puede aparecer, al igual que sucede en la extinción en
para guiar nuestro propio comportamiento, algo que parece
vivo, un aumento de la conducta que se pretende
resultar más efectivo que si es otra persona la que nos
extinguir. Puede ser útil combinar este procedimiento con
presenta una nueva regla. A medida que crecemos, por
el RPE.
tanto, aprendemos que seguir reglas (o normas) suele
14 Nociones básicas sobre aprendizaje

conducir a ciertas recompensas o nos permite evitar castigos.


Así, una regla funciona como un estímulo discriminativo
pudiendo llegar a controlar nuestro comportamiento. Incluir el
uso de reglas en un programa de modificación de conducta
resulta especialmente eficaz cuando se desea un cambio de
conducta rápido, cuando las consecuencias que podrían
reforzar la conducta deseada se demoran demasiado, cuando
se desee mantener una conducta cuyos refuerzos naturales
son inmediatos pero altamente intermitentes, y en aquellos
casos en los que una conducta específica lleva a un castigo
severo e inmediato.

Hay que tener en cuenta los factores que afectan a la


probabilidad de que un individuo siga una regla. Así, se siguen
menos las reglas que implican consecuencias poco probables
o que describen pequeñas consecuencias inmediatas pero que
son perjudiciales o beneficiosas sólo después de que se han
acumulado (esto es, tras una gran demora). En cambio, parece
que aquellas reglas que describen fechas límites para la
realización de conductas específicas llevan a conseguir
resultados más probables e importantes. Por último, parece
que hay contextos donde es más probable que haya un
seguimiento de las reglas que otros en función de la historia de
aprendizaje previa en dicha situación contextual.

Bibliografía consultada

Bandura, A. (1982). Teoría del aprendizaje social. Madrid:


Espasa-Calpe.

Froufe, M. (2004). Aprendizaje asociativo. Principios y


aplicaciones. Madrid: Thomson.

Hayes, S.C. (1989) (Ed.), Rule-governed behavior. Cognition,


contingencies, and instructional control. Nueva York:
Plenum Press.

Liberman, R.P. (1974). Iniciación al análisis y terapéutica de la


conducta. Barcelona: Fontanella

Martin, G. y Pear, J. (2007). Behavior modification: what it is


and how to do it. New Jersey: Prentice Hall.

Pérez, M. (1996). Tratamientos psicológicos. Madrid:


Universitas.

También podría gustarte