Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APRENDIZAJE
CONTENIDOS:
1. TEMA 1. Aprendizaje preasociativo: Habituación y sensibilización.
2. TEMA 2. Condicionamiento clásico.
➢ Aplicaciones del condicionamiento clásico.
3. TEMA 3. Condicionamiento instrumental u operativo.
➢ Aplicaciones del condicionamiento instrumental.
-1-
TEMA 1: APRENDIZAJE PREASOCIATIVO:
HABITUACIÓN Y SENSIBILIZACIÓN
INTRODUCCIÓN
En los animales con un sistema nervioso poco desarrollado prácticamente toda su conducta está
regida por instintos.
Los patrones de acción modal (PAMs) son secuencias de respuestas típicas de cada especie.
La diferencia entre instinto y los PAM es que los PAMs requieren de un estímulo señal (o estímulo
desencadenante).
EJEMPLO: Respuesta de picotear a un punto rojo del pico del progenitor en crías de gaviotas.
Timbergen y Perdeck (1950) se preguntan qué provoca esta respuesta → ESTÍMULO SEÑAL
¿Qué rasgos del estímulo desencadenante son los que inician la respuesta de la pauta de acción
modal (PAM)?
-2-
RESPUESTA REFLEJA
Un reflejo es una respuesta automática ante un determinado estímulo. Esta conducta es causada por
conexiones fijas innatas en el sistema nervioso. Ej: Reflejo de succión.
ARCO REFLEJO:
Reflexología o estudio del comportamiento reflejo: Sechenov (1829 – 1905); Ivan P. Paulov (1849 –
1936).
“Un reflejo es un patrón estereotipado de movimientos de una parte del cuerpo que puede ser
provocado por la presentación del estímulo adecuado”
El reflejo nos permite responder inmediatamente a los estímulos (E’s) del entorno.
Así recuperamos el equilibrio del organismo. Son una respuesta correctora a un desequilibrio que se
haya producido.
-3-
APRENDIZAJE
El APRENDIZAJE, por el contrario, permite ANTICIPAR aquellas situaciones en las que el organismo
saldrá del ESTADO DE EQUILIBRIO y actúa antes, previniendo el DESEQUILIBRIO que se puede
producir.
El aprendizaje tiene limitaciones dado que requiere de un entorno estable y conocido, y no siempre
se dan estas condiciones.
Por tanto, hace falta además un MECANISMO DE AUTOCONTROL (no necesariamente voluntario).
Entonces, ¿por qué la psicología del aprendizaje se interesa por los reflejos?
No siempre que se presenta un estímulo se desencadena una respuesta con la misma intensidad. La
conducta refleja se puede modificar a partir de la experiencia y estará influenciada por la adaptación
y sensibilización. Ej: Hacer apnea en la piscina.
DEFINICIONES DE APRENDIZAJE:
→ El aprendizaje es un cambio inferido (no lo podemos observar directamente, sino que solo
podemos suponerlos a partir de la conducta manifestada) en el estado mental de un
organismo, como consecuencia de la experiencia e influencia de manera relativamente
permanente en el potencial del organismo para la conducta adaptativa posterior.
El psicólogo Donald O.Hebb (1949) realizó una importante contribución en las neurociencias:
Teoría sobre como el aprendizaje está mediado por cambios estructurales en las sinapsis → Según
la teoría, cuando un axón de una neurona “A” se encuentra suficientemente cerca para estimular
una neurona “B”, algunos cambios que suceden en la primera neurona “A” incrementan la
actividad de estimular la neurona “B”.
-4-
El aprendizaje:
− Provoca cambios en la mente
− Desarrolla nuevas asociaciones
− Debilita o potencia las asociaciones existentes
− Se reflejará en la conducta solo cuando sea necesario
El aprendizaje asociativo está basado en la vinculación en el espacio y el tiempo de dos hechos (en
su relación de contingencia).
Las asociaciones que dan lugar al condicionamiento se dan debido a la contigüidad o proximidad
temporal y espacial. Ej: una cosa pasa justo después de la otra en el mismo lugar.
→ “… es muy provechosos que el condicionamiento sea la adquisición del conocimiento sobre las
relaciones entre acontecimientos y que la mejor forma de considerar el cambio en la conducta
que registra el experimentador es a modo de índice de este conocimiento”.
Aprendizaje = Conocimiento
APRENDIZAJE PREASOCIATIVO
HABITUACIÓN Y SENSIBILIZACIÓN
Eric Kendel continuó los trabajos de Hebb y descubrió las bases sinápticas del aprendizaje. Descubrió
que, durante el aprendizaje, la actividad conjunta de dos neuronas las enlazaba.
Para sus experimentos utilizó el caracol marino Aplysia Californica. Cuando se siente amenazada, la
Aplysia activa un reflejo de protección de sus partes más vulnerables (la branquia, el sifón y la cola.
-5-
▪ HABITUACIÓN: Es aquel comportamiento de aprendizaje en el que una respuesta declina con la
presencia repetida del estímulo.
En el caracol, la respuesta de protección disminuía ante la estimulación repetida con un rayo de
agua (habituación) → Durante la habituación, la sinapsis cambia. Disminución del influjo de
calcio (Ca2), que reducía la liberación del neurotransmisor → Reducía la despolarización de la
membrana postsináptica.
-6-
En relación al comportamiento, a menudo se produce un PATRÓN BIFÁSICO que se expresa mediante
una SENSIBILIZACIÓN INICIAL seguida de una RESPUESTA DE HABITUACIÓN.
Ambos, habituación y sensibilización, son el resultado final de procesos que nos ayudan a organizar
nuestra conducta en un entorno con gan cantidad de estímulos.
Ejemplos de estudios:
CARACTERÍSTICAS DE LA HABITUACIÓN:
-7-
CARACTERÍSTICAS DE LA SENSIBILIZACIÓN:
La Habituación y la Sensibilización son dos fenómenos que representan cambios en la conducta como
consecuencia de la experiencia de un individuo en relación a un estímulo que se presenta
repetidamente. En este sentido lo podemos considerar un APRENDIZAJE SIMPLE o PREASOCIATIVO.
Existen dos procesos naturales (Habituación y Sensibilización) que NO son excluyentes y que
pueden activarse simultáneamente.
El resultado neto es la resta entre los procesos → ganará aquel proceso (habituación o
sensibilización) que se active con más fuerza.
Según los autores de la teoría, el proceso de Habituación estaría relacionado con el Sistema E-R
(arco reflejo), mientras que el segundo proceso, el de Sensibilización, se relacionaría con el
llamado Sistema de Estado, en el que estarían implicadas otras partes del sistema nervioso. El
Sistema de Estado puede verse afectado por las drogas o los estados emocionales como el
miedo.
Ej: En el caracol marino Aplysia una estimulación repetida hace disminuir la cantidad de
neurotransmisor en las sinopsis.
-8-
2. TEORÍA DEL PROCESO OPONENTE. (Solomon y Corbi, 1974)
▪ El Proceso A se activa inmediatamente después de la presentación de un estímulo → Este
Proceso A se puede entender como un estado emocional directamente relacionado con la
calidad motivacional del estímulo. (Ej: Una descarga eléctrica genera miedo, un estado
fisiológico asociado que se expresa, entre otras manifestaciones, con un incremento de la
tasa cardiaca)
▪ El Proceso B se activa también a partir de la presentación del estímulo, pero actúa de forma
más lenta → Se opone al Proceso A y hace disminuir la reactividad del estímulo.
La teoría asume que, una vez el estímulo deja de presentarse, el Proceso A desaparece
inmediatamente, pero el Proceso B sigue actuando un tiempo más.
- 10 -
TEMA 2: CONDICIONAMIENTO CLÁSICO
DEFINICIÓN DE APRENDIZAJE:
APRENDIZAJE ASOCIATIVO
El aprendizaje asociativo está basado en la vinculación en el espacio y el tiempo de dos hechos (en
su relación de contingencia).
Las asociaciones que dan lugar al condicionamiento se dan debido a la contigüidad o proximidad
temporal y espacial. Ex: algo pasa justo después de la otra en el mismo lugar.
CONDICIONAMIENTO CLÁSICO
Podemos considerar a John Locke y David Hume precursores de los planteamientos del Condicionamiento
Clásico.
“Las experiencias se originan en los sentidos, y estas experiencias se ASOCIAN entre sí para formar nuestro
conocimiento del mundo”
Paulov (finales s.XIX) adopta el principio de Asociación entre Estímulos y la aplica a la investigación
científica del aprendizaje.
- 11 -
MODELO DE CONDICIONAMIENTO CLÁSICO PAULOVIANO
Pavlov observó que una respuesta o reflejo incondicionado (salivación, la succión, la respiración…)
también se podía observar ante un evento o estímulo distinto al que la provoca de forma innata.
El condicionamiento clásico se produce por la asociación de dos estímulos que tienen una contigüidad
temporal: uno que produce una respuesta innata y otro que no la produce (estímulo neutro).
TERMINOLOGÍA:
- 12 -
SOBRE LOS ESTÍMULOS:
Algunos estímulos son eficaces cuando los utilizamos como EC, en tanto que otros necesariamente
funcionan como EI.
Que un EC o un EI sean efectivos para generar aprendizaje depende en parte de que sean nuevos o
causen sorpresa en el sujeto.
Los estímulos familiares NO suelen provocar respuestas tan intensas, la atención prestada es menor
y, por tanto, se produce menos aprendizaje o tarda más en producirse.
Por lo general, los estímulos intensos se condicionan antes que los débiles. Con todo, si la intensidad
del EC o del EI es excesiva, el aprendizaje puede verse dificultado.
La asociación entre EC y EI debe ser relevante o pertinente. Es decir, hay estímulos que se asocian
más fácilmente entre sí que otros. Esto está relacionado con cómo se asocian los estímulos en el
medio natural (Ej: El malestar se asocia más a EC gustativos y, en cambio, el dolor de las descargas
eléctricas a EC audiovisuales).
Los EC provocan inicialmente respuestas menos intensas en los organismos que los EI.
- 13 -
FASES DEL CONDICIONAMIENTO CLÁSICO:
➢ 1ª FASE:
En esta fase está presente el Estímulo Incondicionado (EI), que provoca una Respuesta
Incondicionada (RI), que es una respuesta innata o heredada que NO ha sido aprendida
previamente.
Ejemplos:
− Comida (EI) provoca respuesta de Salivación (RI).
− Aire en la cara (EI) provoca Parpadeo (RI).
− Pinchazo (EI) provoca Retirar el brazo (RI).
− Sonido fuerte (EI) provoca Lloro en el bebé (RI).
En esta fase también encontramos Estímulos Neutros (EN), que provocan una Respuesta Neutra
(RN).
Ejemplos:
− Campanilla (EN) NO provoca respuesta de Salivación (RI).
− Gota de agua (EN) NO provoca Parpadeo (RI).
− Olor de comida (EN) NO provoca Retirar el brazo (RI).
− Juguete (EN) NO provoca Lloro en el bebé (RI).
➢ 2ª FASE:
En esta fase se presentan Estímulos Neutros (EN) inmediatamente después del Estímulo
Incondicionado (EI), de forma que se genera la Respuesta Incondicionada (RI).
El EN, que pasará a ser el Estímulo Condicionado (EC), y el EI se pueden presentar con diferentes
patrones temporales (al mismo tiempo, uno antes que el otro, uno cuando el otro ha finalizado,
de forma aleatoria…)
➢ 3º FASE:
Esquema de esta 3ª fase: El Estímulo Condicionado (EC) – anterior Estímulo Neutro (EN) – pasa
a generar la Respuesta Condicionada (RC).
Ejemplos:
− Campanilla (EC) provoca respuesta de Salivación (RI).
− Gota de agua (EC) provoca Parpadeo (RI).
− Olor de comida (EC) provoca Retirar el brazo (RI).
− Juguete (EC) provoca Lloro en el bebé (RI).
- 14 -
EJERCICO: CONDICIONAMIENTO CLÁSICO
➔ FASE 1:
− EI = Agresión sexual provoca RI = Miedo
− EN = Noche/Hombres provoca RN = Estado normal
➔ FASE 2: EN (Noche/hombre) + EI (agresión sexual) = RI (Miedo)
➔ FASE 3: EC (salir de noche/ver hombres) provoca RC (miedo)
EJERCICIO 2:
a) Alguien recibe una mala noticia en el momento en el que entraba en el metro y se siente muy
agobiado por la mala noticia. Al cabo de unos días cuando vuelve a entrar en el metro nota
agobio.
➔ FASE 1:
− EI = Mala noticia provoca RI = Agobio
− EN = Entrar al metro RN = Estado normal
➔ FASE 2: EN (entrar al metro) + EI (mala noticia) = RI (agobio)
➔ FASE 3: EC (entrar al metro) provoca RC (agobio)
b) Una persona come muchas cerezas y tiene una indigestión. Ahora cada vez que siente hablar de
cerezas se le revuelve el estómago.
➔ FASE 1:
− EI = Empacho provoca RI = Indigestión malestar
− EN = Ciruelas RN = Estado normal
➔ FASE 2: EN (empacho) + EI (ciruelas) = RI (indigestión malestar)
➔ FASE 3: EC (ciruelas) provoca RC (dolor de estómago/malestar)
- 15 -
c) En el colegio no todos los niños salen al patio en el mismo momento. En 1º cuando suena el
timbre los del grupo A se van al patio y los del grupo B van a psicomotricidad, donde se estiran
en el suelo en circulo y se relajan. Explica el proceso para los del grupo A y los del Grupo B cuando
suena el timbre.
GRUPO A:
➔ FASE 1:
− EI = irse al patio provoca RI = activación
− EN = sonar el timbre provoca RN = Estado normal
➔ FASE 2: EN (timbre) + EI (irse al patio) = RI (actuación)
➔ FASE 3: EC (timbre) provoca RC (activación)
GRUPO B:
➔ FASE 1:
− EI = Psicomotricidad sexual provoca RI = relajación
− EN = sonar el timbre provoca RN = Estado normal
➔ FASE 2: EN (timbre) + EI (psicomotricidad) = RI (relajación)
➔ FASE 3: EC (timbre) provoca RC (relajación)
d) Un niño ve una película de miedo en su habitación y ahora cada vez que entra a la habitación
tiene miedo.
➔ FASE 1:
− EI = película de miedo provoca RI = Miedo
− EN = habitación provoca RN = Estado normal
➔ FASE 2: EN (habitación) + EI (película de miedo) = RI (Miedo)
➔ FASE 3: EC (habitación) provoca RC (miedo)
e) Una pareja se conoce mientras suena una canción concreta. Ahora cada vez que oyen la canción
sienten una emoción especial.
➔ FASE 1:
− EI = Conocerse provoca RI = emoción especial
− EN = Canción provoca RN = Estado normal
➔ FASE 2: EN (canción) + EI (conocerse) = RI (emoción especial)
➔ FASE 3: EC (canción) provoca RC (emoción especial)
f) Qué crees que pasa cando le enseño la correa a mi perro (le pongo la correa cada vez que salimos
a la calle).
➔ FASE 1:
− EI = Salir a la calle provoca RI = alegría por salir
− EN = correa RN = Estado normal
➔ FASE 2: EN (correa) + EI (salir a la calle) = RI (alegría)
➔ FASE 3: EC (correa) provoca RC (alegría por salir)
- 16 -
El Condicionamiento Clásico ha sido estudiado en diversos ámbitos: relaciones personales, trabajo,
educación, adicción a sustancias, psicopatologías... y en un gran número de especies animales:
monos, perros, gatos, aves… sobre todo con ratas, conejos y palomas.
PROCEDIMIENTOS EXPERIMENTALES:
Reflejo de parpadeo con conejos albinos (aire o leve descarga eléctrica sobre el tercer párpado
o membrana nictitante).
Estudiado con palomas. Esta especie golpea con el pico lo que le indica que ahí hay comida.
Otras especies también se acercan a la comida por el olfato, ruidos o movimientos.
Se relaciona con la tendencia de muchos animales a acercarse y contactar con los estímulos que
informan de la disponibilidad de comida (Domjan y Bukhard, 1993).
EC (sabores nuevos → Ej: H2O y sacarina, o jarabes de varios gustos sin efectos).
EI (sustancia que hace enfermar o encontrarse mal → Ej: Inyecciones de ClLi o ciclofosfamida
que provocan náuseas; exposición intensa a los rayos X)
Se puede dar una fuerte asociación en un solo ensayo de aprendizaje, lo que demuestra que se
trata de un aprendizaje muy importante para la supervivencia (Ej: Un veneno).
El aprendizaje puede producirse aunque pasen varias horas entre la ingesta de un nuevo sabor
y la aparición de los efectos negativos (Ej: Algunos venenos tardan horas o incluso días en hacer
efecto sobre el organismo).
- 17 -
➢ Condicionamiento del MIEDO:
El estímulo aversivo suele ser una descarga eléctrica en las patas y el EC un tono o luz que se
enciende cuando se va a producir la descarga eléctrica.
La medida indirecta del miedo se realiza por medio de la Razón de Supresión (medida
cuantitativa del grado de supresión de la conducta del sujeto, es decir, la medida indirecta del
miedo que el sujeto experimenta frente al nuevo estímulo).
Respuestas al EC
Razón de supresión =
Respuestas al EC + Respuestas que el sujeto daba antes de la aparición del EC
El valor de la Razón de Supresión varía entre 0 (parálisis absoluta) y 0.5 (nada de miedo).
El Estímulo Neutro (EN) se suele presentar antes que el Estímulo Incondicionado (EI).
La relación temporal entre EC y EI puede ser de diversos tipos.
Hay que distinguir entre CONTIGUIDAD y CONTINGENCIA
CONTIGÜIDAD Y CONTINGENCIA:
CONTIGÜIDAD: La relación entre dos estímulos que se presentan JUNTOS en el tiempo (no es
condición suficiente para que se produzca condicionamiento).
También puede existir asociación entre EC y EI cuando hay una separación temporal entre la
presentación de ambos estímulos de horas o incluso de días. Esta cuestión ha hecho plantear que
la condición clave en el Condicionamiento Clásico es el hecho de que la relación entre EC y EI sea la
de que el EC debe suponer un buen predictor de la aparición de la EI (CONTINGENCIA).
- 18 -
La relación entre la aparición del EC y la aparición posterior del EI NO siempre es una cuestión de
TODO o NADA.
La capacidad del EC de predecir EI dependerá de la cantidad de veces que EC aparezca antes que el
EI y de la cantidad de veces que el EI aparezca por separado (Rescorla, 1967).
Las relaciones entre los EC y los EI seguirían la Ley de la Probabilidad: la relación entre ellos NO
vendría dada por el Principio de Contigüidad sino por el PRINCIPIO DE CONTINGENCIA.
Los Valores de Probabilidad se mueven entre 0 y 1 y, por tanto, los valores de contingencia pueden
variar entre +1 y -1.
EI No EI 𝑎 𝑐
P(EI / EC) = P(EI / no EC) =
EC a b 𝑎+𝑏 𝑐+𝑑
No EC c d
El aspecto clave del Modelo de Contingencia entre EC y EI será que el emparejamiento entre ambos
estímulos NO es suficiente para que se produzca condicionamiento clásico, sino que ES NECESARIO
que el EC sea un BUEN PREDICTOR de la aparición del EI (Condicionamiento Clásico Excitador) o de
la NO aparición del EI (Condicionamiento Clásico Inhibitorio)
➢ Condicionamiento SIMULTÁNEO:
- 19 -
➢ Condicionamiento de DEMORA:
En este procedimiento el EC se presenta un poco antes que el EI. Además, el EI aparece antes
de que el EC haya desaparecido.
Es similar al anterior, aunque no tan efectivo, ya que a medida que se incrementa el Intervalo
de Huella va decayendo la intensidad del condicionamiento. En este caso se presenta primero el
EC, pero el EI NO se presenta hasta que el EC ha desaparecido un tiempo antes.
Ej: Las lluvias en otoño (EC) nos indican que 21 días después puede que salgan setas (EI), por
tanto, la RI sería ir a buscar setas y la RC sería ir 21 días después de que haya llovido.
Se consigue una asociación del EC y del EI en un 50% de las veces después de 4 sesiones de
entrenamiento.
- 20 -
OTROS PROCEDIMIENTOS DE CONDICIONAMIENTO CLÁSICO:
➢ Condicionamiento ALEATORIO:
Los EC y los EI se presentan de forma aleatoria de forma que a veces coinciden y otras no. Las
contingencias se dan al azar.
Los condicionamientos simultáneo, hacia atrás y aleatorio NO permiten que el sujeto prediga la
aparición del EI, por lo que son los que menos condicionamiento producen.
➢ Condicionamiento TEMPORAL:
Hacen falta muchos ensayos para asociar el EC y el EI. Ej: Poner el despertador a la misma hora.
➢ La ADQUISICIÓN:
El Estímulo Neutro (EN) se convierte en Estímulo Condicionado (EC) → que genera una
Respuesta Condicionada (RC)
Fuerza de la Rc
Ensayos de asociación Ec y Ei
➢ La EXTINCIÓN:
Se produce cuando, una vez el EN se ha convertido en EC, y este lleva una tasa estable de RC,
dejamos de emparejar EC con el EI. La fuerza de la RC se irá debilitando poco a poco, llegando
incluso a desaparecer.
Ensayos de asociación Ec y Ei
La extinción es, y ha sido empleada en gran medida en el ámbito clínico por medio de la
Modificación de Conducta.
Ej: Tratamiento de las fobias.
No todas las RC se extinguen de la misma forma. En general, cuanto más fuerte sea la RC, más
costará extinguirla.
➢ La RECUPERACIÓN ESPONTÁNEA:
Fuerza de la Rc
➢ La GENERALIZACIÓN y la DISCRIMINACIÓN:
Estímulos muy DIFERENTES pueden ser catalogados de IGUAL forma y estímulos muy IGUALES
pueden ser categorizados de manera DIFERENTE.
Ej: Agorafobia o fobia a los perros (cachorros).
- 22 -
Cuanto más parecidos son los estímulos:
− Más fácil es la Generalización
− Más difícil es la Discriminación
− (Y viceversa)
El estudio de los gradientes de generalización nos permite conocer hasta qué punto una
característica de un estímulo (Ej: el volumen, el color o la textura) es importante en la regulación
de la conducta de un sujeto.
− El enfermero Manel lleva una bata verde, Albert tiene que ir a pincharse cuatro veces por
semana. Pasados unos meses, Albert se siente inquieto cuando tiene que comer alimentos que
son de color verde como las judías, brócoli… → (Adquisición) + Generalización
− Cada día que Abril entra en el horno de pan de debajo de casa a comprar el pan la tendera le
regala un caramelo. En verano pasó unos días en casa de su abuela en otro pueblo y le hizo la
boca agua cuando entraba a comprar el pan, hecho que no le pasa cuando entra en la carnicería
- 23 -
o pescadería ni otro establecimiento → Generalización (a las panaderías) + Discriminación (con
el resto de las tiendas)
− Llora un bebé y la abuela lo coge en brazos para calmarlo, pero no lo consigue. El bebé se calma
cuando le coge en brazos la madre → Discriminación
− Alguien tuvo una intoxicación alcohólica tomando ron y, desde entonces, no ha vuelto a probar
el ron ni ninguna otra bebida alcohólica → Generalización
La Silvia y los perros: → Recuperación espontánea (con los perros de sus primos) + Discriminación
(con el perro de su amiga)
a) Adquisición
b) Generalización
c) Extinción
d) Discriminación
La Susana y el mar:
a) Adquisición
b) Extinción Olvido
c) Recuperación espontánea
d) Discriminación
e) Generalización
- 24 -
FENÓMENOS ESPECIALES DEL CONDICIONAMIENTO CLÁSICO:
Los fenómenos especiales del Condicionamiento Clásico son procedimientos de aprendizaje con
pequeñas variaciones de los procedimientos estándar.
➢ El CONTRACONDICIONAMIENTO:
Ej: Asociar un perro (EI que genera miedo) con un juego (EC que genera bienestar); Asociar
alcohol (EI de tipo apetitivo) con un fármaco que genera náuseas (EC de tipo aversivo).
En este tipo de aprendizaje, un Estímulo puede actuar como EI después de haber estado
condicionado.
Este procedimiento podría seguir una Fase 3 una Fase 4… Y entonces hablaríamos de
condicionamiento de 3er orden, de 4ª orden…
➢ El PRECONDICIONAMIENTO SENSORIAL:
El propósito es conseguir que un Estímulo Neutro (EN) se convierta en un EC sin haber sido
asociado a un EI.
➢ El ECLIPSAMIENTO:
Además, según la especie puede haber más predisposición biológica a asociar algunos estímulos
con otros. Tiene relación con el entorno natural de cada una.
➢ El BLOQUEO:
Ej: En condiciones naturales se presentan muchos estímulos. Es una ventaja poderse centrar en
aquellos estímulos que aportan mayor información e ignorar el resto. Si no funcionara el
mecanismo de inhibición, la atención iría cambiando constantemente de un estímulo a otro.
➢ La INHIBICIÓN LATENTE:
La Inhibición Latente muestra una gran dependencia del contexto. Si el mismo estímulo se
presenta en un contexto diferente puede dejar de producirse la inhibición y darse.
➢ La IRRELEVANCIA APRENDIDA:
− 1ª FASE: EN // EI
− 2ª FASE: EN + EI (que provoca una RI).
− 3ª FASE: EC – antes EN – provoca un RC débil o inexistente.
No siempre tenemos que estar expuestos a los EC y a los EI para aprender las relaciones entre unos
y otros.
Ej: Un niño aprende que cuando su padre se pone a ver la TV (EC), él NO irá al parque (EI). El niño no
insistirá en ir a jugar al parque y sacará sus juguetes en su habitación (RC).
Ej: Semáforo y policía. Si el policía nos indica que pasemos con el semáforo en rojo sabemos que
NO nos multarán.
- 27 -
2. Procedimiento de INHIBICIÓN DIFERENCIAL.
Este procedimiento genera menor condicionamiento que el procedimiento anterior, lo que lleva
a pensar en la importancia del contexto excitador.
Donde:
− rHi = incremento en el hábito de aprendizaje (cambios en la asociación EC – RC)
− M = valor máximo del aprendizaje.
− Hi = fuerza del hábito al iniciarse el aprendizaje.
− 0 = parámetro de tasa de aprendizaje (que indica + o - velocidad de aprendizaje)
El EC sería el conjunto de elementos que, en cada ensayo, pueden asociarse con una respuesta
determinada o con su contraria. La teoría llega a un sistema de cuantificación del aprendizaje
muy parecido a la teoría de Hull.
Estos modelos sólo pueden explicar los supuestos de aprendizaje más sencillos, cuando un EC
se asocia a un EI, pero no pueden explicar otros fenómenos más complejos como el
eclipsamiento (ensombrecimiento u overshadowing) o el bloqueo.
- 28 -
MODELOS DE SELECCIÓN DE ESTÍMULOS:
Hacía falta modificar los modelos anteriores ya que se vio que la fuerza asociativa de un E dependía
también de la fuerza asociativa que habían adquirido también otros estímulos durante las sesiones
de entrenamiento.
Lo que planteaba Kamin es que el aprendizaje dependía del grado de sorpresa que provocaba el
EI.
Su teoría permite explicar los fenómenos de bloqueo y de eclipse, aunque el siguiente modelo
recibe más apoyo empírico y es empleado en numerosas investigaciones actuales.
Según el modelo, cuando NO se produce asociación entre los EC y los EI es porque se ha agotado
la capacidad del EI para provocar más condicionamiento.
Este modelo permite explicar el bloqueo de forma más acertada que el modelo de Kamin.
Según este autor, la reducción en la capacidad de producir fuerza asociativa se debe a que se
han producido cambios en la atención que se dedica al EC. Los EC son bloqueados o eclipsados
por una disminución de la atención que se les dedica.
Según Pearce y Hall, los organismos tienen una capacidad de procesamiento limitada respecto
a los EC y los EI que se presentan de forma simultánea. Los estímulos que vayan seguidos de una
consecuencia imprevista serán aquellos con más probabilidades de ser procesados.
El aspecto clave del modelo indica que un estímulo será procesado en la medida que NO sea un
buen predictor de sus consecuencias.
- 29 -
5. Modelo de Tiempo Real de Schmajuck (1997):
Una vez se ha presentado el EC, el sujeto haría una representación interna de él, que variaría en
el transcurso del tiempo x(t).
Para el modelo, el valor de la traza del EC sería máximo poco tiempo después de haber aparecido
el estímulo y decaería de forma negativamente acelerada cuando este dejara de presentarse.
Otros modelos serían el de Sutton y Barto (1990), el modelo SOP de Wagner (1981) y los modelos de
Tiempo Real Complex (Coutureau y cols., 2002; Grossberg, 1975; Honey y Ward-Robinson, 2002;
Schmajuk y Dicarlo, 1992)
Todos ellos han procurado explicar nuevos fenómenos de aprendizaje, pero por ahora, no existe
ningún modelo que permita predecir de forma adecuada todos los fenómenos de aprendizaje
observados en el estudio del condicionamiento clásico.
Hoy en día siguen aflorando fenómenos de aprendizaje diferentes que no habían sido descritos con
anterioridad y será necesario, por tanto, un modelo teórico más amplio que pueda abarcarlos.
- 30 -
APLICACIONES DEL
CONDICIONAMIENTO CLÁSICO
INTRODUCCIÓN
"¿Es posible aplicar los principios de Cambio Conductual generados por Procesos de Aprendizaje
mediante Condicionamiento en condiciones artificiales y de laboratorio, a las situaciones complejas
y ecológicas de la vida cotidiana de los humanos?"
Paulov creía que el aprendizaje y la educación resultaban en gran medida del establecimiento de
nuevas conexiones neuronales.
Es de suponer que el conocimiento de los principios que gobiernan el desarrollo de asociaciones debe
servir para promover técnicas psicológicas prácticas.
TERAPIA DE LA CONDUCTA
El caso del pequeño Albert (11 meses de edad) – Watson y Rayner (1920):
Le presentaron una rata blanca para que jugase. En un principio el niño NO mostraba ningún signo
de miedo. A continuación, cada vez que intentaba cogerla, los experimentadores generaban un
sonido fuerte que sorprendía y asustaba al niño. En pocos ensayos el pequeño Albert
experimentaba miedo cuando se le acercaba la rata.
Se produjo una generalización del miedo hacia otras mascotas y peluches de color blanco. Se trata
de uno de los primeros ejemplos de inducción experimental del miedo.
- 31 -
El caso del pequeño Peter (1924), un niño de unos 3 años – Mary Cover Jones (19896 – 1987):
Contracondicionamiento: Exposición progresiva a los objetos que le daban miedo mientras tenían
lugar experiencias agradables para él como eran jugar o comer aquello que le gustaba.
Muchos miedos pueden haber sido adquiridos por Condicionamiento Clásico y mantenidos por
Condicionamiento Operante.
Ej: Fobia a los aviones → Adquisición del miedo (CC) – Mantenimiento de la fobia (refuerzo
negativo, CO)
Seligman (1971) considera que, por razones evolutivas en el transcurso de la historia de la especie,
los humanos estamos innatamente más predispuestos a desarrollar fobias hacia unos objetos y
situaciones que hacia otros.
Ciertos individuos presentan mayor predisposición a sufrir fobias. Factores hereditarios y cognitivos
juegan un papel importante en el desarrollo de fobias:
El Condicionamiento Clásico puede ser especialmente útil para ayudar a conseguir alteraciones
emocionales.
DESENSIBILIZACIÓN SISTEMÁTICA:
Joseph Wolpe (1958), psiquiatra sudafricano, descontento con los planteamientos y los tratamientos
del psicoanálisis, desarrolla la Desensibilización Sistemática, que se parecía mucho al tratamiento
ideado por Mary Cover Jones.
- 32 -
Para eliminar los miedos se exponía a los pacientes de forma gradual a los objetivos y situaciones
fóbicas. De esta manera podían comprobar vivencialmente que no les pasaba nada en relación a
aquello que pudieran temer.
Posteriormente incluyó otro elemento: alguna actividad incompatible con el temor que lo pudiera
inhibir mientras duraba la exposición (normalmente era la inducción de un estado de relajación).
Acostumbraba a recurrir a las imágenes mentales al para evocar las escenas mudas.
Consta de 3 pasos:
1. Entrenamiento en Relajación: De forma autocontrolada y siguiendo varios procedimientos.
2. Elaboración de la Jerarquía de Ansiedad: Los pacientes establecen una jerarquía rigurosa de
escenas que generan niveles progresivos de temor.
3. Afrontamiento progresivo y sostenido de cada paso de la jerarquía en estado de relajación: Los
pasos a afrontar deben ser asumibles. Si la cadena NO se puede seguir, se retrocede al punto
anterior de seguridad.
Algunos autores consideran que esta técnica NO es explicable por contracondicionamiento. Eysenck
(1976), por ejemplo, afirma que se trata de un simple fenómeno de extinción.
El EC (el temor) disminuiría porque se presenta sin el EI (la experiencia traumática original). Apoya
esta explicación el hecho de que la relajación NO resulta necesaria, es suficiente con la exposición
gradual. Aunque las fobias severas responden mejor al tratamiento si incluyen relajación.
Por otro lado, en la Desensibilización Sistemática es muy probable que intervengan tanto la extinción
como el contracondicionamiento.
➢ TÉCNICAS DE EXPOSICIÓN:
La inundación resulta especialmente útil para los miedos condicionados. También para el
Trastorno por Estrés Postraumático (TEPT) y algunos Trastornos Obsesivos Compulsivos (TOC)
en los que intervienen elementos inductores de ansiedad.
Esta técnica tiene el propósito de reducir el atractivo de los estímulos. Deriva de la aversión
adquirida al sabor.
A partir de los años 50 se revisa la técnica y se le da los usos actuales (Joseph Wolpe).
Esta técnica asocia la visión, olor y sabor (de las bebidas alcohólicas, por ejemplo) con alguna
sustancia emética (que provoca el vómito) como la emetina o el litio.
Se aplica al tabaquismo, a la adicción a otras drogas y también para tratar delincuentes sexuales.
OTRAS APLICACIONES:
➢ APLICACIONES MÉDICAS:
Es posible acabar condicionando la respuesta del sistema inmunitario, endocrino y nervioso ante
determinadas drogas, fármacos o estímulos.
Efecto placebo.
➢ PUBLICIDAD:
Las actitudes, las preferencias, el valor afectivo de las cosas e, incluso, los estados motivacionales
son susceptibles de ser condicionados.
- 34 -
Emparejamiento del producto con personas, términos, imágenes, músicas y escenas altamente
positivas: prestigio, éxito, riqueza, calidad, diversión, belleza, atractivo sexual…
- 35 -
TEMA 3: CONDICIONAMIENTO
INSTRUMENTAL U OPERATIVO
CONDICIONAMIENTO OPERANTE
En el aprendizaje instrumental, una conducta se desarrolla según las consecuencias que produce.
El proceso de aprendizaje a través del cual algunas conductas se mantienen y otros desaparecen en
función del efecto que producen sobre el propio individuo, se denomina condicionamiento
instrumental u operativo.
Una conducta instrumental es aquella que nos sirve para lograr determinadas consecuencias.
Muchos hechos dependen de nuestra conducta.
THORNDIKE:
En 1898 Edward Thorndike realizó varios experimentos con gatos que mostraban que, si una
conducta era seguida por una consecuencia positiva para el organismo que la realizaba, la
probabilidad de que el organismo volviese a ejecutar este comportamiento aumentaba.
- 36 -
Estaba interesado en entender cómo los gatos resolvían los problemas.
Observó su comportamiento en situaciones en las que tuvieron que hacer alguna acción para lograr
un objetivo (escapar de una jaula, conseguir comida, etc.).
Los colocó en una caja problema y midió cuánto tiempo tardaban los gatos en escapar y acceder al
tazón con comida. Observó que el tiempo disminuía. Dijo que los gatos resolvieron el problema
probando errores.
Para Thorndike, la explicación del aprendizaje estaba en las conexiones que se establecen entre los
estímulos y las respuestas a partir del ensayo y error.
De esta manera, los organismos adquieren progresivamente aquellas conductas que producen
consecuencias positivas, a la vez que se suprimen aquellos comportamientos que conducen a
consecuencias desagradables. En otras palabras, la recompensa aumenta las respuestas, mientras
que el castigo las elimina. De ahí su Ley de efecto:
"Cualquier conducta que en una situación produzca un resultado satisfactorio, será más probable en
el futuro".
Si la consecuencia es positiva, se está reforzando la conducta y cada vez la realizará más rápido ante
el estímulo → Aprendizaje
Cuantas más veces repitamos esta conducta más rápido la aprenderemos. Sin embargo, si dejamos
de realizar la conducta, cada vez será mayor el olvido.
- 37 -
Paralelamente, Thorndike pensaba que la repetición de una respuesta fortalece la conexión entre el
estímulo y la respuesta, mientras que la falta de práctica debilita esta conexión (E-R). A este principio
lo llamó la LEY DEL EJERCICIO.
Si bien las ideas de Thorndike son recordadas más como antecedentes de las teorías modernas que
por su valor actual, la influencia de ideas como el poder de recompensa en el aprendizaje han sido
clave en el desarrollo posterior de las teorías del aprendizaje, lo que convierte a este investigador en
una figura muy relevante.
SKINNER:
− Diseñó un dispositivo (la caja de Skinner) que permitiría al organismo emitir la conducta sin
restricciones para poder medir conductas similares a las que tienen lugar en el mundo real.
− Planteó la idea de operante: una unidad de comportamiento que se define por los efectos
que operan en el medio ambiente (da lugar al nombre de condicionamiento operante).
La Caja de Skinner o caja de condicionamiento es una cabina con diversos elementos que sirven para
ejecutar respuestas y presentar estímulos (palancas y llaves de respuesta, dispensadores de
alimentos, rejilla metálica para descargas eléctricas, altavoces, luces, etc.)
Cuando el animal (ratón) premia casualmente la palanca (respuesta) recibe comida (estímulo -
refuerzo).
Si en los ensayos discretos la conducta del animal estaba restringida por las condiciones programadas
por el investigador, en la preparación del operante libre es el animal el que determina cuándo y con
qué frecuencia realizará su conducta a lo largo del tiempo.
Skinner propuso la Tasa de Respuesta como una medida para analizar el comportamiento operativo.
La forma más común de medir la tasa de respuesta es a través del registro acumulativo de respuestas
(forma de representar la repetición de una respuesta a lo largo del tiempo).
- 38 -
Skinner no habla de la asociación estímulo-respuesta, sino del incremento de la fuerza de la respuesta
debido a las consecuencias que le siguen.
Las respuestas a una situación que van seguidas de refuerzo se fortalecen y es más probable que se
repitan en el futuro.
Ej: Se pone a llover, abrimos el paraguas (Conducta) y NO nos mojamos (No Estímulo)
Se pone a llover, NO abrimos el paraguas (NO Conducta) y nos mojamos (Estímulo).
APRENDIENDO A ASOCIAR:
El condicionamiento clásico y operante siguen procesos diferentes, aunque nada impide que se den
juntos para lograr el establecimiento de conductos.
De hecho, no es raro que aparezcan juntos en la vida diaria ni en los procedimientos experimentales.
CONDICIONAMIENTO
CONDICIONAMIENTO CLÁSICO
OPERANTE
Una respuesta (R) va seguida
Se emparejan dos estímulos
SUCEDE CUANDO… por un estímulo reforzante
(EI y EC)
(Eref)
NATURALEZA DE LA Involuntaria: elicitada por el Voluntaria: emitida por el
RESPUESTA estímulo organismo
ASOCIACIÓN QUE REQUIERE EC – RC R – Eref
- 39 -
PROCEDIMIENTOS DEL CI
− El primer parámetro es si lo consecuente hace que la conducta aumenta o, por el contrario, hace
que disminuya. Este parámetro está relacionado con el carácter apetitivo (agradable) o aversivo
(desagradable) de la consecuencia o la situación consecuente que se genera.
− El segundo parámetro está relacionado con la forma en que se presenta (o desaparece) el
consecuente: puede aparecer después del comportamiento, o puede desaparecer como
consecuencia de este, o el comportamiento puede prevenir su aparición.
Así que:
− A un hecho agradable lo llamaremos Estímulo Apetecible
− A un hecho desagradable lo llamaremos Estímulo Aversivo
Un REFUERZO es cualquier estímulo que aumenta la probabilidad de una conducta. Hay 2 tipos:
1. REFUERZO POSITIVO:
Si hay R (respuesta), entonces hay E- (estímulo aversivo) → Ej: Si ponemos el dedo en el enchufe
Si NO hay R, entonces NO hay E- nos electrocutamos.
- 40 -
3. REFUERZO NEGATIVO:
EFECTO
La conducta se La conducta se
incrementa elimina
REFUERZO POSITIVO
Se administra CASTIGO POSITIVO
(buenas
(aparece) (colleja)
calificaciones)
ESTÍMULO
REFUERZO NEGATIVO CASTIGO NEGATIVO
Se suprime
(exento de hacer (no ver TV durante la
(desaparece)
tareas de casa) semana)
- 41 -
Contingencia de respuesta y
Resultado
resultado
POSITIVO: La respuesta genera Reforzamiento o aumento en
REFUERZO POSITIVO
un estímulo apetitivo la tasa de respuesta
POSITIVO: La respuesta genera Castigo o disminución en la
CASTIGO POSITIVO
un estímulo aversivo tasa de respuesta
NEGATIVO: La respuesta elimina
REFUERZO NEGATIVO Reforzamiento o aumento en
o previene la ocurrencia del
(escape /evitación) la tasa de respuesta
estímulo aversivo
NEGATIVO: La respuesta elimina
ENTRENAMIENTO POR Castigo o disminución en la
o previene la ocurrencia de un
OMISIÓN (RDO) tasa de respuesta
estímulo apetitivo
ELEMENTOS DEL CI
Thorndike creía que era este Estímulo Discriminatorio el que controlaba la conducta
instrumental, SKINNER demostró que no, que era el Estímulo de Refuerzo.
Algunos límites en este sentido están relacionados con la preparación biológica de los
organismos para enfrentar ciertas situaciones, otros tienen que ver con la interferencia de
conductas innatas con las que se quiere condicionar.
- 42 -
THORNDIKE → Concepto de PERTENENCIA: "Ciertas conductas son coherentes con el reforzador
por la historia evolutiva de la especie". Manipular objetos o apoyarse en la pared son
comportamientos naturales de un gato al escapar de una jaula, bostezar o rascarse no.
Algunas conductas impedían la presentación del reforzador con gran fuerza, tenían que ver con
el poder instintivo del mismo o, como lo llamaban los autores, la deriva instintiva.
(Los sujetos se alejan de los comportamientos reforzados hacia los comportamientos instintivos
que aparecen cuando se busca el refuerzo).
3. EL ESTÍMULO REFORZADOR:
En este punto llegamos a una definición circular: la comida es un reforzador porque aumenta la
conducta contingente y la conducta contingente aumenta porque la comida es un reforzador.
- 43 -
Se pueden hacer contingentes dos conductas.
Se restringe la conducta preferida (1) y se establece que solamente se tendrá acceso a ella si
previamente se ha dedicado cierto tiempo a la conducta menos preferida (2).
Como consecuencia cualquier conducta puede actuar como reforzador de la segunda si se dan
las condiciones indicadas.
Ej: El dinero → No es un estímulo primario biológicamente hablando. Lo hemos ido asociando con
todos los bienes que podemos llegar a obtener con él.
En el condicionamiento instrumental:
− El EI hace de reforzador (primario).
− El EC es el Estímulo Neutro que hará de reforzador condicionado o secundario (después de
emparejarlo con el reforzador primario).
El poder del reforzador generalizado depende de que continue asociado a los reforzadores primarios.
VARIABLES INFLUYENTES EN EL CI
HUTT (1954): Cuanta más cantidad y calidad del reforzador (de la comida en sus experimentos
con ratas), mayor es la Tasa de Respuesta Instrumental.
Los efectos de CONTRASTE (tanto + como - ) dependen de la cantidad y calidad del refuerzo
recibido en el pasado.
FLAHERTY (1996): Los mecanismos que actúan sobre el CONTRASTE + y el CONTRASTE – serían
diferentes.
- 44 -
B) CONTIGUIDAD TEMPORAL Y CONTINGENCIA:
Los procesos de aprendizaje nos permiten extraer qué regularidades se dan en nuestro entorno.
Algunos estímulos dependen de nuestro comportamiento (en mayor o menor medida) y otros
no.
Se han tenido en cuenta dos tipos de principios para explicar cómo se asocian 2 eventos:
1. El principio de CONTIGÜIDAD TEMPORAL
2. El principio de CONTINGENCIA
Sin embargo, también aprendemos las relaciones entre la conducta y el reforzador, aunque
la recompensa NO se proporciona inmediatamente.
Los resultados indican que cuando se señala un Reforzador Retardado, se incrementaban los
juicios de la relación causal entre respuesta y reforzador respecto a cuando el reforzador NO
estaba señalado. La señal que ilumina el botón del ascensor una vez lo hemos pulsado actúa
como reforzador secundario o acondicionado.
2. El principio de CONTINGENCIA:
Existen suficientes ejemplos que nos indican que la Contigüidad Temporal NO es suficiente
ni necesaria para el establecimiento de relaciones. De lo contrario, tendríamos la cabeza llena
de asociaciones irrelevantes.
Un programa de refuerzo es el conjunto de criterios que determina si una conducta irá seguida por
un refuerzo o no.
Se establecen en base al NÚMERO DE RESPUESTAS que hace falta dar y al TIEMPO que debe pasar
desde que se ha presentado un reforzador y que el siguiente está disponible.
- 45 -
Se han estudiado sus efectos sobre:
1. Mantenimiento de conductos ya adquiridos.
2. Extinción de conductas que se quieren eliminar.
En situaciones de Operante Libre los diferentes programas simples de refuerzo provocan patrones
de respuesta bien definidos y diferenciados.
TIPOS:
PROGRAMAS DE REFORZAMIENTO
➢ REFUERZO CONTINUO:
Un prgrama de Reforzamiento Continuo es aquel en el que cada vez que aparece una Respuesta
Operante va seguida de un Reforzador.
Ej: En un trabajo el sueldo (reforzador) se da únicamente una vez al mes, a final de mes (IF 1
mes). No importa si trabajs mucho durante este mes, ni cuántas veces vayas al médico, solo
recibirás un nuevo sueldo un mes después del anterior.
Los programas en los que la respuesta NO siempre va seuida del reforzador se llaman programas
de Reforzamiento Parcial o Intermitente.
Ej: Puedo llevar al cine a mis hijos una vez cada 4 semanas como media (IV 4 semanas). Si no se
portan bien no les llevo, pero si se portan bien los llevaré solo si hace tiempo que no vamos,
como media, si hace 4 semanas que no vamos. Por muy bien que se porten, no los llevo hoy y
mañana otra vez.
- 46 -
PROGRAMAS DE RAZÓN:
Este programa es más lento, más persistente y con una mayor resistencia a la extinción.
Los Programas INTERMITENTES de RAZÓN FIJA (RFn) generan un patrón de respuesta característico.
Si la razón es bastante grande se observa que NO hay respuesta durante un tiempo después de
recibir el reforzador. Este fénomeno se llama PAUSA POSTREFORZAMIENTO. Pasada esta pausa los
sujetos inician la respuesta con una tasa alta y estable hasta lograr el nuevo reforzador. Este
fenómeno se llama CARRERA DE LA RAZÓN.
Los incrementos en la razón NO pueden ser excesivamente grandes porque sino se deja de
responder.
Cada vez que se incrementa la razón de forma repentina y significativa aparece lo que llamamos
TENSIÓN DE LA RAZÓN: pausas periódicas durante la carrera de la razón. Si la tensión es extrema,
el sujeto puede dejar de responder.
Se considera que estas pausas tienen que ver con la evaluación que hace el sujeto del esfuerzo que
le hará falta para lograr el siguiente reforzador.
La Tasa de Respuesta en los Programas de Razón Variable (RVn) es más estable que en los de Razón
Fija (RFn).
- 47 -
PROGRAMAS DE INTÉRVALO:
En los Programas de Intérvalo, a demás de dar cierto número de respuestas para obtener el
reforzador, se añade una segunda condición: tiene que haber transcurrido cierto tiempo entre la
presentación del anterior reforzador y el momento en el que el siguiente está disponible.
El periodo de tiempo es FIJO (Ej: IF1 semana → para ver una serie).
Igual que en el RF, los sujetos dejan de responder después de recibir el reforzador. Ahora bien, a
diferencia de los RF en los que seguidamente la Tasa de Respuesta era estable y alta, en los
programas IF la tasa aumenta exponencialmente (al final del intérvalo la tasa se dispara).
Parece que los sujetos experimentales disponen de algún mec anismo de medida del tiempo.
A medida que va pasando el tiempo la probabilidad de recibir el reforzador es más elevada y, por
tanto, se va incrementando la Tasa de Respuesta.
También existen los Prgramas INTERMITENTES de INTÉRVALO VARIABLE o IV en los cuales el tiempo
es imprevisible. Por ejemplo, en un programa IV2’ el reforzador está disponible a partir de 2’ de
media de tiempo desde que se ha presentado el último reforzador. En este tipo de programas la
Tasa de Respuesta es más estable y desaparece el patrón de gráfico exponencial.
Nos puede importar también una restricción del tiempo durante la cual estará disponible el
reforzador. Por ejemplo, el reforzador puede estar disponible pasados 2’ pero dejar de estarlo
pasado 20’’ más. → Esta situaciçon experimental se llama ESPERA LIMITADA y se puede aplicar
tanto a IF como a IV.
- 48 -
GRÁFICAS TÍPICAS DE LOS REGISTROS ACUMULATIVOS DE LOS 4 PROGRAMAS DE REFUERZO
SIMPLES:
− En los programas fijos (RF y IF) se observa una pausa de respuesta después de recibir el
reforzador. En los variables esta pausa NO está.
− Los programas de Razón (R) generan más Tasa de Respuesta que los de Intérvalo (I).
Esto puede ser debido al hecho de que en los primeros la obtención del reforzador depende de
las respuestas del sujeto, mientras que en el segundo caso, además, interviene el tiempo. Los
primeros generan más motivación que los segundos.
Una explicación alternativa estaría relacionada con los procesos de reforzamiento. En los
programas de Razón (R) se refuerzan los tiempos cortos entre respuestas. En el caso de los
programas de Intérvalo (I) se refuerza que se espere un tiempo entre respuesta y respuesta y,
por tanto, un periodo de tiempo largo y dilatado.
- 49 -
EJERCICIOS CONDICIONAMIENTO INSTUMENTAL U OPERANTE
REFORZAMIENTO POSITIVO:
− Darle una chuche a un niño cada vez que hace bien todos los deberes.
− Dejarle ver media hora de tele si cena todo sin quejarse.
− Hacer un regalo por sacar muy buenas notas en el trimestre.
CASTIGO POSITIVO:
− Mandar copiar 100 veces.
− Aumentar el nº de flexiones a hacer en un entrenamiento.
− Prolongar la realización de la tarde durante una semana más.
REFORZAMIENTO NEGATIVO:
− Exento de hacer los deberes “extras”
− Exento de madrugar el fin de semana.
− Exento de llevar a cabo cierta obligación.
CASTIGO NEGATIVO:
− No jugar a la play hasta que no recupere la asignatura.
− No salir con los amigos el fin de semana.
− No ir a la fiesta que quería.
2. Explica los siguientes casos de condicionamiento instrumental u operante usando todos los
conceptos técnicos necesarios:
− Cada vez que María estudia durante 2 horas seguidas, sus padres le sueltan al parque para
jugar con sus amigos. Al cabo de un tiempo, Maria estudia durante dos horas seguidas cada
tarde → Refuerzo positivo
− Cuando Xavier no hace la cama por las mañanas, sus padres no le dejan bajar al parque para
jugar con sus amigos. Al cabo de un tiempo siempre hace la cama por la mañana → Castigo
negativo (porque disminuye la conducta de no hacer la cama porque sino le dejan sin
parque)
- 50 -
− Cuando el perro de Raquel deja de ladrar, le quitan el bozal. Después de un tiempo el perro
de Raquel casi nunca labra. → Refuerzo negativo de evitación (porque la conducta de no
ladrar aumenta y desaparece el bozal, no ladra para evitarlo)
PROGRAMA CONCURRENTE:
También se puede calcular otro parámetro que permite ver si la distribución de respuestas está
influenciada por el refuerzo obtenido en cada alternativa. Este parámetro es la TASA RELATIVA DE
REFORZAMIENTO.
Las fórmulas:
La conclusión que se extrae es que los sujetos experimentales ajustan la Tasa Relativa de Respuestas
a cada uno de los programas de forma que se acerquen mucho a la Tasa Relativa de Reforzadores
obtenidos para aquella alternativa.
Esta ley se ha mostrado válida para otros parámentros del reforzamiento como son la magnitud, la
inmediatez y la calidad, y tanto para el condicionamiento aversivo como para los programas simples
de refuerzo.
Cabe decir que la Ley de Igualación NO se cumple en los Programas de Razón y que la ley NO explica
porqué se produce alternanza.
- 52 -
TEORÍAS EXPLICATIVAS DE LA CONDUCTA DE ELECCIÓN:
➢ MAXIMIZACIÓN:
Los individuos alternan entre dos fuentes de reforzamiento con tal de lograr el máximo de
reforzadores. Sin embargo, esta teoría NO puede explicar porqué las tasas relativasa de
respuesta se ajustan en la LEY de la IGUALACIÓN.
➢ Teoría de la MEJORA:
Esta teoría propone que los sujetos irán haciendo ajustes en su distribución de respuestas hasta
que las tasas locales de las dos alternativas se igualen. Entonces ya no se puede mejorar la
situación. Esta teoría predice que las distribuciones de las respuestas se ajustan exactamente a
aquello que predice la LEY de IGUALACIÓN.
Se presentan dos alternativas y el sujeto experimental escoje una de ellas. No podrá cambiar a la otra
hasta pasado un cierto tiempo. Pasado este tiempo se le permite una nueva elección.
Una de las opciones ofrece un refuerzo grande pero demorado, mientras que la otra provee un
refuerzo pequeño pero inmediato. Ej: Estamos en casa estudiando y nos llaman los amigos para ver
si queremos salir a dar una vuelta.
Rechlin y Green (1972): Los sujetos experimentales prefieren un refuerzo pequeño pero inmediato.
Ahora bien, cuando se introduce un Tiempo de Demora entre el momento de elecciñon y el acceso
al programa, el resultado es el contrario. Aloraba una especie de autocontrol (tanto en humanos
como en otras especies). La demora resta valor a un reforzador.
Mazu (1987) ha propuesto una función matemática para valorar la pérdida de valor de un reforzador
en función de la magnitud de esta y la demora para conseguirlo. Se llama la FUNCIÓN DEL
DECAIMIENTO HIPERBÓLICO:
- 53 -
EXTINCIÓN DE LA RESPUESTA INSTRUMENTAL
El procedimiento pasa, en primer lugar, por averiguar qué es lo que está reforzando a la conducta
objetivo y después eliminar ese reforzador.
Muchos pueden ser los motivos (reforzadores) que pueden incitar y mantener las conductas
disruptivas.
Ej: Así el niño puede obtener algunos privilegios como dejar de realizar alguna tarea, ser el
protagonista del grupo en ese momento, reafirmar su liderazgo, etc.
En ocasiones, la conducta no deseable puede ser muy persistente y el reforzador que la mantiene ser
tan inapreciable que es difícil descubrirlo.
La forma en que dejamos de responder es diferente cuando se trata de una máquina de café o bien
cuando se trata de una máquina tragaperras. En el primer caso dejamos de responder enseguida si
no nos sale el vaso de café, pero en el segundo caso podremos observar una resistencia a la extinción.
A este efecto lo llamamos EFECTO DEL REFORZAMIENTO PARCIAL.
Las conductas reforzadas con programas intermitentes son más difíciles de extinguir que las
reforzadas con programas continuos.
Hay cierta evidencia a favor de una teoría alternativa llamada Teoría secuencial de Cpaldi (Capaldi,
1966, 1967). Esta teoría está formulada en términos de conceptos de memoria. Asume que los
sujetos pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado
reciente. El sujeto aprende a responder siempre que recuerde no haber sido reforzado en los ensayos
precedentes.
- 54 -
EFECTOS DE LAS TÉCNICAS BASADAS EN LA EXTINCIÓN:
Las técnicas basadas en la extinción, además de disminuiur la conducta, suelen tener diversos efectos
importantes que debemos conocer:
1. Efectos en la CONDUCTA:
Además, la conducta que está sometida a extinción puede aumentar en intensidad, frecuencia
y duración (Ej: las rabietas pueden volverse más violentas, frecuentes y duraderas) cuando
iniciamos la intervención.
Ej: Si el ascensor se estropea podemos reaccionar clavándole alguna cosa / Conductas agresivas
en el deporte.
CONDICIONAMIENTO ADVERSIVO
CONDICIONAMIENTO AVERSIVO: Se utiliza el castigo para reducir una respuesta determinada. Esta
respuesta (conducta) provoca la aparición de un Estímulo Aversivo.
REFORZAMIENTO NEGATIVO:
- 55 -
Se han propuesto diferentes explicaciones en este sentido:
Los 2 factores de la teoría son, por un lado el Condicionamiento Clásico y, por el otro, el
Condicionamiento Instrumental.
1º Condicionamiento Clásico:
EI = Descarga, RI = Miedo, EC = Oscuridad, RC = Miedo
2º Condicionamiento Instrumental:
E = Oscuridad, R = Escapada a un entorno iluminado, C = Reducción del miedo.
Este planteamiento combia la evitación por la escapada. Es sencillo de explicar con el paradigma
del Condicionamiento Instrumental.
Esta teoría considera que el Condicionamiento Clásico del miedo NO es necesario para que se
de la respuesta de evitación.
Consideran que la evitación se realiza en base a las expectativas de resultados o lo que se espera
que suceda.
Se genera una discrepancia entre lo que ocurrirá (la NO descarga eléctrica) y lo que se espera que
ocurrá (la descarga eléctrica)
- 56 -
No respuesta de evitación → No presentación del E-
REFUERZO NEGATIVO
Escapada Evitación
Contingencia
Negativa Negativa
Respuesta – Reforzador
Consecuencia de la
Elimina un Estímulo Aversivo Impide un Estímulo Aversivo
respuesta
Resultado sobre la
Se mantiene la conducta Se mantiene la conducta
conducta
− Teoría de los 2 Factores
Condicionamiento − Teoría de 1 Factor (Contingencia)
Teorías
Instrumental − Teoría Cognitiva (discrepancia
entre la expectativ y la realidad)
CASTIGO:
Skinner (1938) concluyó que el castigo tenía un efecto de supresión de la conducta, pero que este
efecto era temporal.
Azrin (1960). Si el castigo es suave la respuesta se recupera. Cuando el castigo era más intenso se
podía dar un descenso o la completa desaparición de la respuesta a largo plazo. (Otros
procedimientos también generan la supresión de la conducta sin tener que recurrir al castigo, como
la Supresión Condicionada a través del Condicionamiento Clásico Pauloviano).
Schuster y Rachlin (1968) demostraaron que la supresión de la respuesta durante el castigo era
debido a la contingencia entre la respuesta y el estímulo aversivo.
El castigo, por tanto, tendría sobre la conducta efectos opuestos al refuerzo positivo.
1. Es necesario introducir el Estímulo Aversivo con la máxima intensidad desde el inicio. En caso
contrario se puede producir habituación.
2. La eficacia aumenta si el Castigo Positivo se presenta con inmediatez. La demora reduce o
anula la eficacia de suprimir la conducta.
3. Los programas continuos aumentan la eficacia, así como el hecho de que la razón sea lo más
pequeña posible, a la hora de eliminar una conducta.
- 57 -
4. La motivación influye en la eficacia del castigo (si un animal tiene mucho hambre, o poca, o
nada, influirá en la conducta)
¿Cómo suprimir una condcta sin tener que recurrir al castigo con otra intensidad de estímulo
aversivo? Pues hace falta identificar y después devaluarlo. El reforzador se puede dispensar de
forma NO contingente a la conducta que queremos castigar.
Ej: Prestar atención al niño en los momentos en los que se porta bien y no cuando NO se
porta bien, que han estado reforzados hata ese momento con la atención de los padres.
5. Ofrecer Conductas Alternativas a la conducta castigada que proporcione el mismo reforzador
tamién aumenta la eficacia del reforzador.
Ej: En la Modificación de la Conducta, si un terapeuta castiga la conducta de pelearse, a la
vez puede reforzar la conducta coperativa.
6. El papel del Castigo como señal del Reforzador.
Una persona puede aprender que la única forma de recibir refuerzo es siendo castigada.
Entonces buscará situaciones en que se de el castigo. Así explican Azrin y Hotz (1963) el
comportamiento masoquista.
Ej: Solo se recibe la atención de los padres cuando se porta mal.
1. El castigo puede generar reacciones emocionales como el miedo o el enfado, que interfieren
en el aprendizaje y en la ejecución.
Experimento de Balaban, Rhodes y Neuringer (1990) en los que se castigaba a unos estudiantes
cuando se equivocaban en una tarea de memoria, a un grupo con una descarga eléctrica y al
otro con un sonido. Los de la descarga iban más lentos y cometían más errores.
2. El castigo puede suprimir otras conductas diferentes a las que se castiga.
Ej: El profesor que castiga las “preguntas estúpidas” estará provocando que tampoco se
formulen otro tipo de preguntas.
Además, supone una gran dificultad en la vida real hacer un seguimiento de las conductas
susceptibles a ser castigadas.
Ej: El niño que es castigado por pegar a su hermano, procurará hacerlo cuando no le vean
y, además, probablemente negará la evidencia cuando le pillen haciéndolo.
3. El castigo puede provocar conductas agresivas ante la persona que lo administra o hacia otras
personas cercanas.
Azrin y Holtz (1963): El castigo NO es recomendable especialmente si hay otras técnicas que
empleen estímulos apetitivos.
- 58 -
Hace falta tener muy en cuenta el aspecto ÉTICO del castigo.
Es importante continuar el estudio debido a que son inevitables muchas situaciones de la vida
cotidiana en las que el castigo aparece (errores en la conducción, olbido del trabajo…)
GENERALIZACIÓN Y DISCRIMINACIÓN
La Generalización y la Discriminación pueden definirse como propiedades de los Estímulos que nos
permiten controlar las Conductas.
Ambas afectan tanto a los Estímulos Condicionados (EC) como a los Estímulos Discriminativos (ED).
De entre todos los estímulos o de todas las características de estos estímulos, solamente algunas de
ellas llegan a tener el Control sobre la Conducta. Sin embargo, en principio sin un entrenamiento
específico cualquier característica podría llegar a adquirir control sobre la conducta.
Según Lashley y Wade (1946), la Generalización es la consecuencia de la incapacidad del sujeto para
diferenciar los estímulos. Se daría una confusión entre el estímulo de prueba y aquellos estímulos
utilizados durante el entrenamiento.
Dicho de otra forma, la Generalización es la relación sistemática entre la Fuerza de la Respuesta a los
Estímulos Generalizados y la similitud de estos estímulos con el Estímulo utilizado durante el
entrenamiento original.
GRADIENTE DE GENERALIZACIÓN:
Para estudiar los Gradientes de Generalización se lleva a cabo, inicialmente, una primera fase de
entrenamiento en la que se enseña al sujeto a responder ante un determinado estímulo (Ej: Una luz
de un determinado color).
En un segundo momento (2ª fase, de prueba) se presenta el Estímulo de la prueba y otros estímulos
que varían en el color. En esta fase NO se facilitan Reforzadores. Se registran las respuestas.
- 59 -
Ésta es la distribución típica de los Gradientes de Generalización del Experimento de Guttman y
Kalish:
En algunos estudios se utiliza 1 solo Estímulo Discriminativo o E+ (si hay presencia de E+, entonces
encontramos también Reforzador; si NO hay E+, entonces NO hay tampoco Reforzador).
En otros procedimientos se utilizan 2 Estímulos diferentes para indicar cuándo hay y cuándo NO hay
Reforzador.
Los experimentos con una Discriminación Intradimensional (Ej: un tono de 1000Hz – E+ – y un tono
de 950Hz – E- –) producen la discriminación más afinada.
El experimento de Kohler (1939) con pollitos y distintos tonos de color demostró que los animales
podían aprender a manipular conceptos abstractos.
Acababan escogiendo el gris más claro, lo que indicaba que habían aprendido, no a escoger el mismo
color sino que habían aprendido que necesitaban escoger el color más claro, aunque no coincidiera
- 60 -
con el estímulo empleado con anterioridad. La hipótesis relacional se impuso a la hipótesis absoluta.
Este fenómeno recibe el nombre de TRANSPOSICIÓN.
Por lo tanto, se observa que el individuo responde no en función de las características de cada
estímulo, sino en función de la relación entre estos (que la “traspone” o aplica de la relación
aprendida anteriormente).
El Desplazamiento del Vértice del Gradiente de Generalización se refiere al alejamiento del máximo
del Gradiente de Generalización respecto al E+ original y en dirección opuesta al E-.
Fenómeno que demostró Hanson (1959), el cual se pude observar después de un entrenamiento
previo de discriminación simultánea en el que se utiliza un procedimiento en el que se refuerza una
conducta ante un estímulo (E+) y no ante otra (E-), y también en estudiar posteriormente el gradiente
de generalización.
Lo que caracteriza este gradiente (es lo que conocemos como desplazamiento del vértice) es que la
tasa más elevada de respuestas se observa ante un estímulo diferente del estímulo que previamente
se había reforzado, el estímulo ante el que el sujeto emite un número mayor de respuestas se
“desplaza” en sentido inverso al estímulo que había aprendido previamente a no responder (E-).
Se trata de una teoría que puede explicar de forma elegante los fenómenos de Transposición y
Desplazamiento del Vértice.
Punto de partida: Los sujetos experimentales aprenden solo sobre los estímulos de forma individual
y NO aprenden nada respecto a las relaciones entre ellos. En un entrenamiento Intradimensional, el
E+ adquiere fuerza excitadora y el E- adquiere fuerza inhibitoria.
Segundo supuesto de Spence: Ambas fuerzas (E+ y E-) forman sus respectivos Gradientes de
Generalización Excitatorio e Inhibitorio (este último demostrado por Honig, Boneau, Burstein y
Pennypacker, 1963).
Spence afirma que en el continuo Intradimensional algunos valores se verán afectados por fuerzas
excitadoras e inhibidoras simultáneamente, que se contrarrestarían.
En la naturaleza, los Estímulos que debemos discriminar NO son puros y pueden variar en más de una
dimensión.
1. Proceso de ATENCIÓN:
Atendemos a una dimensión que sobresale (brillo o color, por ejemplo). Si esta es reforzada
estaremos más atentos. Si no es el caso, estaremos atentos a otra dimensión que, si resulta
relevante para obtener el reforzador, hará que tendamos a estar más pendientes.
APRENDIZAJE PERCEPTIVO:
Según Gibson y Walk (1956), “la sola exposición a los estímulos complejos (por ejemplo triángulos o
círculos) es suficiente para facilitar la discriminación entre estímulos.”
El efecto es robusto y no es necesaria una exposición larga ni tampoco que los animales sean jóvenes.
Gibson (1969): "La exposición a los estímulos antes del entrenamiento permite a los sujetos extraer
las características diferenciadoras".
McLaren, Kaye y Mackintosh (1989, 2000) proponen una Teoría Asociativa del Aprendizaje
Perceptivo. “Todo estímulo está formado por varios elementos. Cuando comparten muchos
elementos en común, la discriminación entre ellos será difícil”.
Bandura i Walters (1963): “Observamos la conducta de los demás, observamos las consecuencias y,
posteriormente, imitamos sus conductas”.
Estas experiencias (1ª infancia, ...) siguen los principios de la Teoría del APRENDIZAJE SOCIAL: las
conductas se aprenden a través del Condicionamiento Clásico, del Condicionamiento Instrumental y
del Aprendizaje por Observación o Imitación.
- 62 -
TEORÍA DE LA IMITACIÓN:
Varios autores (Baldwin, James, McDougall, Morgan...) han considerado que existe una
tendencia innata a imitar.
Experimentos de Meltzoff y Moore (1977, 1983) encontraron que los niños de entre 12 y 21 días
ya imitaban 4 gestos que habían escogido para su investigación.
Parecería que los humanos nacemos con la capacidad de asociar determinadas entradas
sensoriales (la visión de un adulto haciendo un determinado gesto sensorial) con un conjunto de
movimientos musculares que permiten al niño realizar el mismo movimiento que ven.
¿Se trata de un fenómeno exclusivamente humano? → Thorndike encontró que NO. Robert
(1990) reunió más de 200 estudios sobre Aprendizaje Observacional con otras especies.
Kawai (1965) habla de la observación de cómo los monos japoneses limpiaban la tierra de una
especie de boniatos. También se ha observado en aves.
Dollard y Miller (1941) consideraron que la imitación es una forma de Respuesta Instrumental.
La conducta del modelo sería el Estímulo Discriminativo y la Respuesta Reforzada sería la misma
o muy similar a la que ofrece el modelo.
Hay que ser prudentes a la hora de aceptar esta teoría ya que sólo sería viable en situaciones en
las que el aprendiz observa el comportamiento del modelo, copia de inmediato la conducta y
recibe el reforzamiento para hacerlo.
El propio Bandura (1969) hace notar que muchas de las conductas aprendidas por observación
NO siguen ese patrón.
- 63 -
Experimento de Lashley (1924) con ratas que debían andar sobre agua y después debían nadar
para alcanzar el reforzador.
Bandura encontró 2 aspectos que NO podían ser explicados por la Teoría de la Generalización
de la Imitación:
a) Las consecuencias que reciben los modelos influían en la conducta de los niños.
− Los del modelo reforzado: MÁS agresivos.
− Los del modelo castigado: MENOS agresivos.
b) Cuando Bandura reforzaba los 3 grupos para imitar el modelo de una película, los 3 grupos
mostraban MUCHA CONDUCTA AGRESIVA.
Bandura concluyó que NO era necesario el Refuerzo para aprender una conducta a través de la
observación, pero SÍ que se necesitaba que la conducta se ejecutara.
Bandura (1969, 1986) propone Teoría Cognitiva del Aprendizaje por Observación, a partir de la
cual identifica 4 procesos implicados:
− Las personas que proporcionan más refuerzo, tanto afectivo como de otros tipos, tienden a
ser más imitadas. Experimento de Bandura y Huston, 1961.
− Las personas que tienen más poder sobre el imitador tienden a ser más imitadas. El concepto
de PODER o CONTROL equivale al de Dominancia en el grupo social. Experimento de Mischel y
- 64 -
Grusec (1966) con la nueva profesora titular o profesora visitante. También con el niño
dominante o una cheer-leader.
− Similitud entre el Modelo y el Observador.
− Sinceridad del Modelo. Se imita más aquel modelo que parece más sincero. La Teoría de la
Generalización de la Imitación considera que cada una de estas variables reflejan los efectos
de la experiencia pasada del niño pero, por el contrario, la Teoría de Bandura del Aprendizaje
por Imitación considera que reflejan las expectativas que tiene el niño de refuerzo futuro.
− Los niños tienden a imitar más las conductas agresivas que las niñas.
− Los niños pequeños (4 años) imitan más que niños mayores (9 años).
− Los niños dominantes (a los que se imitaba más) tendían a mostrar mayor conducta imitativa.
− Las personas menos seguras tendían a imitar más el comportamiento de los demás.
Experimento de Roberts, Boone y Wurtele, 1982
CARACTERÍSTICAS DE LA SITUACIÓN:
− Las situaciones ambiguas provocan más inseguridad y, por tanto, más imitación. Experimento
de Thelen, Paul y Dollinger, 1978
− A mayor dificultad de la tarea, mayor imitación.
− La forma de presentar el Modelo NO era una característica significativa (Bandura, 1962)
FOBIAS: No hay demasiado apoyo a la idea de que el Aprendizaje por Observación esté en la base
del desarrollo de fobias.
Los teóricos del Aprendizaje Social (Rosenthal y Zimmerman, 1972, 1978) defienden que el
Aprendizaje por Observación es el principal mecanismo para el desarrollo de habilidades cognitivas.
Ejemplo de un experimento con niños de 7 años respecto a la labor de conservación.
Bandura ha sugerido que el Aprendizaje por Observación puede influir en el juicio de los niños en
relación a qué conductas son buenas y qué malas (Bandura y McDonald, 1963)
El aprendizaje por observación como herramienta en terapias de conducta y para facilitar conductas
con baja probabilidad de aparición, la adquisición de nuevas conductas, la eliminación de miedos y
deconductos no deseadas.
- 65 -
APLICACIONES DEL
CONDICIONAMIENTO INSTRUMENTAL
La aplicación profesional y sistemática del Condicionamiento Instrumental u Operante se inicia en la
década de los 50 del siglo pasado a partir de los trabajos de Skinner.
Se aplican en principio con el propósito de Modificar la Conducta de niños autistas, de personas con
retraso mental, psicóticas o con otras problemáticas como el consumo de tabaco y varias drogas.
Y para potenciar la relajación en personas que sufren de dolor de cabeza, por poner un ejemplo.
ÁMBITO ESCOLAR
Se utiliza el Condicionamiento Instrumental para fomentar conductas adaptativas así como disminuir
las desadaptativas como hablar mucho y en voz alta, levantarse del sitio, molestar a los compañeros,
etc...
Aplicación de programas (Skinner, Keller,…) que plantean la partición de los contenidos académicos
en pequeñas unidades o pasos; además, permiten que cada estudiante siga su propio ritmo de
aprendizaje para evitar en lo posible los fracasos, proponen controles frecuentes y no penalizar los
fracasos sino volver a trabajar la materia no superada, proporcionar de forma inmediata
retroalimentación sobre el rendimiento y reforzar el logro y las respuestas correctas.
- 66 -
ESTRATEGIAS PARA LA MODIFICACIÓN DE LA CONDUCTA EN EL AULA:
Según Martin y Pear (2007), la modificación de conducta implica la aplicación sistemática de los
principios y técnicas de aprendizaje para evaluar y mejorar los comportamientos encubiertos y
manifiestos de las personas y facilitar así un funcionamiento favorable.
1. Identificar la conducta
2. Evaluación previa al tratamiento: se hace una evaluación conductual para saber la dimensión
del problema antes de la introducción del programa de modificación de conducta. Supone la
recogida y el análisis de datos e información para identificar y describir los objetivos
comportamentales, especificar las causas probables del comportamiento, elegir las estrategias
de intervención más adecuadas para modificarlo y evaluar los resultados del tratamiento.
3. Fase de tratamiento: se instaura un programa para conseguir la mejora de esta conducta. Los
programas de modificación de conducta implican la observación y el registro continuo del
comportamiento a lo largo del tratamiento.
4. Fase de seguimiento: se observa atentamente si se mantienen los avances conseguidos en el
tratamiento una vez concluido.
Si queremos cambiar una conducta inadecuada o enseñar algo nuevo, lo primero que debemos hacer
es identificarla tan objetivamente como sea posible.
Para ello, debemos definirla en términos específicos que requieran un mínimo de interpretación, es
decir, de forma clara, de modo que pueda ser observada (medida y registrada) por personas
diferentes sin necesidad de hacer suposiciones y/o valoraciones subjetivas.
Por eso, conocer la relación que existe entre la conducta y sus consecuencias , tipos de consecuencias
y cómo utilizarlas es fundamental para garantizar una enseñanza.
▪ Registro continuo: Recoge todas las apariciones del comportamiento durante un período
concreto.
▪ Registro por intervalos: Se selecciona un período específico en el que se observará y registrarán
todas las apariciones del comportamiento.
▪ Registro de intervalo parcial: Sólo se registra la conducta de forma dicotómica (si aparece la
conducta en un intervalo de tiempo concreto o no aparece).
- 67 -
▪ Registro de intervalo completo: Sólo se registra la conducta si persiste durante un intervalo de
tiempo completo.
▪ Registro de muestreo temporal: Se puntúa una conducta como presente o ausente en
intervalos de tiempos breves y temporales.
▪ Muestreo temporal momentáneo: Registro dicotómico de momentos puntuales, como por
ejemplo; las horas en punto.
▪ Observación y registro: Se puede dar un tiempo breve para observar y el mismo para registrar
las conductas.
➢ REFORZAMIENTO:
TIPO DE REFORZADORES:
▪ Reforzadores de consumo: El tipo de alimentos que le gusta comer; los tipos de bebida
que le gusta consumir (leche, refrescos, zumos, otros).
▪ Reforzadores de actividad: Qué le gusta hacer: pasatiempos, trabajos, recoger juguetes,
arreglar las sillas, manualidades, área de tacos, actividad al aire libre, deportes, jardinería,
jugar, ir al parque, etc.
▪ Actividades pasivas: Ver la televisión, escuchar música, charlar, escuchar cuentos.
▪ Reforzadores de manipulación: Qué tipo de juegos o juguetes le interesan: coches,
muñecos, juguetes de cuerda, pelotas, rompecabezas, silbidos, saltar la cuerda, libros
para pintar, pintar, entre otros.
- 68 -
▪ Reforzadores sociales: Qué tipo de estimulación le gusta recibir y de parte de quién:
1. Estimulación verbal: Buen chico!, Bien hecho!, Buen trabajo!, Muy bien!, Sigue así!
2. Contacto físico: un abrazo, un beso, cosquillas, choca cinco (palmadas), balancearse
sobre las rodillas del maestro.
La atención social es un caso especial de reforzador. Por atención se entiende los reforzadores
positivos o negativos administrados intencionadamente o involuntariamente cómo son los
comentarios, gestos, miradas, elogios, censuras, y toda expresión que tienda a premiar o castigar
la conducta.
La aprobación y la atención social parecen una estrategia muy sencilla de utilizar, simple y de
sentido común. Pero a veces es difícil empezar a utilizarla sin recurrir a la estrategia de regañar
o castigar. Intentamos motivar a los demás de un modo negativo (ejemplo atención social).
Ej: que ocurre cuando una conducta se ignora. ¿Qué ocurre al principio? Cómo evoluciona…
Muchas veces no es suficiente sólo con las palabras, pero estas siempre deben acompañar la
entrega de un refuerzo.
ECONOMÍA DE FICHAS:
Es un caso especial de la aplicación del refuerzo y de la extinción. En lugar de utilizar los premios
o los reforzadores directamente, se utilizan fichas que después se intercambiarán por una
variedad de actividades agradables y bienes de consumo.
Los privilegios utilizados como premio sólo se pueden obtener a través de fichas y, si es
necesario, las conductas indeseables se eliminan empleando la técnica de la pérdida contingente
de éstas.
- 69 -
VENTAJAS:
PASOS INICIALES:
1. Decidir las conductas metas, que vienen determinadas por: el tipo de niños con que se
trabaja, por los objetivos a corto y largo plazo que se pretenden conseguir, y por los
problemas comportamentales específicos que pueden interferir con la consecución de
estos objetivos.
2. Registrar la línea base, se parte de que el sujeto pueda emitir la conducta deseada.
3. Seleccionar el tipo de ficha a utilizar (Ej: monedas de chocolate, sellos, caramelos,
gomets…)
4. Identificar la ayuda disponible, con otros niños, maestros auxiliares…
5. Elegir el sitio o sitios para aplicar la.
➢ MODELAJE:
En vez de esperar al momento en que se dé una conducta nueva en su forma final, reforzamos
cualquier parecido de esta nueva conducta.
Se utiliza sobre todo para conductas que todavía no forman parte del repertorio habitual del
sujeto.
- 70 -
El cambio en la pauta de reforzamiento es el elemento esencial del proceso de modelado, ya
que se deja de reforzar una conducta una vez se observa otra que la mejore y la supera.
Hay que tener cierta paciencia, ya que muchas veces se utiliza con personas que aprenden
lentamente o que presentan dificultades.
➢ ENCADENAMIENTO:
El objetivo es la formación de una conducta a partir de otras más sencillas que ya figuran en el
repertorio del sujeto, mediante el reforzamiento de sus combinaciones, es decir, se trata de
conseguir una unidad funcional que está formada a partir de unidades conductuales
preexistentes, por lo que subsumen en una nueva conducta.
En primer lugar, debe analizarse la conducta que se quiere conseguir, para especificar su función
y las conductas componentes. El nivel de detalle de estas dependerá de la tarea y de los
repertorios conductuales que tenga el sujeto, por tanto, debe saberse de qué fragmentos de
conducta dispone.
Esta técnica se utiliza en conductas que el sujeto conoce pero no sabe cómo puede hacerlas, por
ejemplo, en el desarrollo de habilidades domésticas (vestirse, comida, higiene personal, etc.).
TIPOS:
- 71 -
▪ Presentación completa de la tarea: Repetición de toda la cadena de conductos en cada
intento.
Ej 1: Análisis de tareas.
Es un acuerdo que se formaliza por escrito entre dos o más personas, en el que se especifican
las conductas que deberá ejecutar cada una de las partes y las consecuencias que se derivarán,
así como del incumplimiento del acuerdo que recoge el contrato.
Lo importante, es que quede bien claro qué consecuencias se derivarán del cumplimiento o
incumplimiento de las condiciones (conductas) pactadas en el contrato.
CARACTERÍSTICAS:
Escribir y firmar el contrato siempre es una manera de dar énfasis a lo que se intenta hacer, y
además, nos aseguramos que los acuerdos no van a depender de interpretaciones ni del
recuerdo de las partes.
- 72 -
Conviene incluir bonificaciones adicionales si la persona supera el mínimo del contrato, así lo
hará lo mejor posible.
Debe ser negociado y correcto por ambas partes y debería ser posible la renegociación.
Se debería eliminar una vez se han establecido nuevas pautas de conducta y de reforzamiento.
Uno de los objetivos debería ser disminuir la dependencia sobre el contrato y mantener las
nuevas conductas y los refuerzos de una forma informal en el ambiente natural.
➢ EXTINCIÓN:
La extinción es probablemente el método operante más utilizado para reducir y/o eliminar la
conducta disruptiva. Consiste en suprimir el reforzamiento de una conducta previamente
reforzada.
LA RETIRADA DE ATENCIÓN: Esta técnica supone una aplicación del principio de extinción, en
especial para aquellas conductas que se manifiestan con desobediencia, desafío o también (en
niños más pequeños) con rabietas, llantos… pero sin llegar a ser manifestaciones excesivamente
agresivas.
Por ejemplo, un niño pequeño que está acostumbrado a ser el protagonista (todos los adultos
le prestan atención) cuando lleva a cabo una rabieta, es muy probable que si se le deja de
prestar atención (excepto caso de fuerza mayor) y su escenificación pasa por no tener
espectadores, esa conducta tienda a reducirse o desaparecer.
Muchos niños en clase pueden desarrollar recursos desadaptados para llamar la atención del
maestro/a. En caso de conseguirlo esta conducta quedará muyu reforzada.
La mejor solución es obviar las conductas no deseadas (en la medida de lo posible) con la retirada
de atención para dársela a medida que la conducta vaya mejorando.
La idea no es transmitir: "Cómo te portas mal no me interesas", sino: "Si haces las cosas
correctamente puedo estar más contigo".
- 73 -
Hay situaciones en las que la retirada de atención, tal y como se ha planteado, no puede ser
aplicable dado que van acompañadas de conductos más subidas de tono como lanzamientos de
objetos o deambulación por el aula.
Se retira un reforzamiento (Ej: dinero o puntos) cada vez que se produce la conducta objeto del
tratamiento. Ejemplos de la vida cotidiana serían las multas o las retiradas de puntos del carnet
de conducir cuando se cometen infracciones de tránsito.
Al aplicarla es importante evitar que la persona pierda todos los reforzadores, sobre todo al
principio, y que el coste de la respuesta por la conducta inadecuada pueda ser fácilmente
reemplazado.
Los sujetos deben saber el coste de la conducta que tendrá la realización de la conducta a
eliminar.
Por ejemplo para un niño puede resultar muy desagradable quedarse sin patio durante unos
días, no poder jugar al fútbol con su equipo de la escuela o perderse la clase de informática para
repasar matemáticas. También dejar de ir a una excursión o no poder participar en una actividad
colectiva.
- 74 -
Una conocida técnica con la que también puede aplicarse el coste de la respuesta es la Economía
de fichas, donde al niño se le retiran algunos puntos o fichas que son intercambiables por
reforzadores naturales (chucherías, juguetes…)
Se trata de retirar las condiciones del medio que permitan la obtención del reforzamiento o
quitar a la persona del medio, durante un período determinado, de manera contingente a la
realización de una conducta desadaptada.
En situaciones normales, lo que se intenta con esta forma de proceder es retirarlo a un espacio
poco interesante y alejado de otras actividades.
Lo ideal sería que fuera un lugar donde el niño no tuviera otro tipo de posibilidad que no fuera
aburrirse soberanamente. Se trata de aislarlo de posibles refuerzos positivos (hablar con sus
compañeros, dejar de realizar alguna actividad interesante...).
Estudio de Rortvedt y Miltenberger (1994) con dos niñas de 4 años que desobedecían de forma
continuada las demandas de su madre. Se reforzó a las niñas cuando hacían lo que tenían que
hacer, pero se les ponía en otro lugar durante 1 minuto de cara a la pared sentadas cuando
desobedecían. La mejora se mantenía 8 semanas después.
1. Asegurarse de que el sujeto puede llevar a cabo la conducta alternativa a la que se quiere
eliminar.
2. Ser consistente en aplicarla.
3. Arreglar una zona en la que se pueda aislar a la persona sin que se pueda entretener
haciendo otras conductas que le resulten agradables. Zona cercana para poder ponerlo
en práctica de manera contingente.
4. Realizarlos de una duración moderada cuando se usa con niños. Se comienza con períodos
breves, que si no son eficaces, se pueden ir alargando.
5. Dar un aviso previo a la aplicación del tiempo fuera del medio y señalar que realiza la
conducta inadecuada.
6. Recordar el final del tiempo fuera. Volver al medio al terminar el tiempo definido. Si sigue
haciendo la conducta inadecuada avisarle de que puede continuar más tiempo en este
sitio hasta que sea capaz de dejar de hacerlo.
- 75 -
➢ PRÁCTICA MASIVA (SADOLLAMENT):
− Haciendo que el sujeto ejecute la conducta que se quiere eliminar de una forma masiva.
Por ejemplo, fumar muy rápidamente e intensamente y terminar el cigarrillo en 5
chupadas. O un niño que sólo quiere comer patatas fritas. Se le da sólo esto para el
desayuno, almuerzo, merienda y cena. Hasta que le produzca saciedad.
− Proporcionando el refuerzo que mantiene la conducta en tanta cantidad o durante tanto
tiempo que pierda el valor de recompensa.
Hay que tener mucho cuidado en el diseño de las sesiones porque si no se es eficaz en la
inducción a la aversión, entonces podría reforzarse esta conducta. Por tanto, la práctica debe
ser lo suficiente masiva para que resulte aversiva para el sujeto.
➢ CASTIGO POSITIVO:
Hace falta que sea el últimi recurso debido a los efectos colaterales perjudiciales que produce.
Investigación de Lovaas y Simmons (1969) con autistas con conductas autolesivas grabes. Se les
administraban descargas eléctricas controladas. Se emplean los SIBIS (Self-Injurious Behaviour
Inhibiting System) o Sistema de Inhibición de la Conducta Autolesiva, que es un dispositivo
detector de golpes que administra descargas eléctricas al detectarlos. La eficacia del tratamiento
se manifestó en el tiempo a través de los registros de los 5 años siguientes.
Los métodos punitivos (de castigo) más frecuentes utilizados por los padres son:
▪ Regaños / Reprimendas: Se caracterizan por un elevado volumen de voz, con tono imperativo y
de rechazo, comprende una restricción de la conducta del niño y puede acompañarse de una
amplísima gama de amenazas que, en general, nunca llegan a ser cumplidas y que se prometen
una y otra vez delante de situaciones similares. Por lo general,su efecto es muy a corto plazo y
el niño termina por no hacerle mucho caso.
- 76 -
▪ Pegar: Va desde darle un golpe en el culo con la mano hasta el uso de violencia extrema que
recuerda a las torturas. Sus escasos beneficios son de corta duración y en general el padre o la
madre que los utiliza acaba por arrepentirse de haberlo hecho, es frecuente que despierte
sentimientos de culpa y hacen que acto seguido, por lástima y culpabilidad, se le permita al niño
cualquier tipo de conducta.
▪ Castigo físico: El niño sentado, acostado, arrodillado, derecho de cara a la pared, entre otras
formas que pueden llegar a ser muy crueles. Sus efectos en general son más duraderos que los
métodos anteriores.
▪ Castigo psicológico: Consiste en una amplia gama de privaciones, prohibiciones y restricciones.
Van desde no dar (objetos, regalos, premios, permisos…) hasta sacar los que ya tenía. Suelen ser
efectos muy duraderos.
CRÍTICAS:
- 77 -
ÁMBITO LABORAL
PROPÓSITOS:
Se suele utilizar el Refuerzo Inmediato (que no es necesario que sea de tipo material sino que puede
constar de elogios verbales, informes favorables…)
ÁMBITO FAMILIAR
Terapia de pareja para promover interacciones recíprocas más positivas (refuerzos) entre los
cónyuges.
El Contrato de Contingencias: acuerdo escrito sobre las conductas requeridas para cada parte y los
beneficios de realizarlas. Elaboración conjunta. Aceptación de los términos y firma.
VENTAJAS:
− Prestar atención a los hijos, destacar su comportamiento y ofrecer otros refuerzos cuando
se lleven bien, vigilando que esta conducta se mantenga.
− No hacer caso de rabietas (si se hizo caso antes puede que tarden un poco en desaparecer
y puede darse un punto exacerbación).
- 78 -
− No gritar ni pegar a los niños cuando se llevan mal y desobedecen. Hay que explicarles
qué han hecho mal y apartarles de cualquier cosa que pueda reforzarles durante un
tiempo.
ÁMBITO CLÍNICO
Niños Autistas: promover Conductas Sociales, Comunicativas y Socialmente Adaptativas con el uso
de Refuerzos, y suprimir otras conductas mediante Tratamiento Aversivo (comportamiento
autolesivos, por ejemplo).
Búsquedas de Lovaas (1966, 1977) con el autismo: MOLDEO PROGRESIVO DE LA CONDUCTA VERBAL.
Cuando se dejaba de aplicar el programa desaparecían rápidamente sus efectos. Se considera que
esta población requiere apoyo ambiental.
Limitaciones de la Modificación de Conducta, pero con personas autistas les capacita para llevar una
vida más aceptable.
ESQUIZOFRENIA:
− Se pueden aplicar de forma más fácil, inmediata y consistente que los refuerzos naturales
convencionales frente a la emisión de conducta adecuada.
− Tienen mayor probabilidad de resultar atractivas al ser cambiadas por una gran variedad de
refuerzos.
− Facilita el manejo de refuerzos con grupos de personas.
Aplicación a numerosos contextos: hospitales, instituciones y clases para niños con retraso mental,
reformatorios para jóvenes con comportamiento antisocial, prisiones, colegios, cuarteles, fábricas y
centros de trabajo...
- 80 -