BLOQUE 1. Aprendizaje

BLOQUE 1
APRENDIZAJE
CONTENIDOS:
1. TEMA 1. Aprendizaje preasociativo: Habituación y sensibilización.
2. TEMA 2. Condicionamiento clásico.
➢ Aplicaciones del condicionamiento clásico.
3. TEMA 3. Condicionamiento instrumental u operativo.
➢ Aplicaciones del condicionamiento instrumental.
-1-
TEMA 1: APRENDIZAJE PREASOCIATIVO:
HABITUACIÓN Y SENSIBILIZACIÓN
INTRODUCCIÓN
La causa de la evolución de la conducta es la necesidad de adaptación al medio y la supervivencia de

los organismos.
Las conductas más básicas son los reflejos y los instintos:
▪ Un reflejo es una respuesta automática ante un determinado estímulo. Esta conducta es

causada por conexiones fijas innatas en el sistema nervioso. Ej: Reflejo de succión.
▪ Los instintos son pautas hereditarias de comportamiento. Son más complejos que los reflejos
y no simplemente reactivos. Se componen por el encadenamiento de conductas reflejas con
una finalidad determinada. Son específicos de cada especie.
En los animales con un sistema nervioso poco desarrollado prácticamente toda su conducta está
regida por instintos.
Los humanos tienen algunos instintos como el de supervivencia, el sexual, el de búsqueda de

alimentos…
Los patrones de acción modal (PAMs) son secuencias de respuestas típicas de cada especie.
La diferencia entre instinto y los PAM es que los PAMs requieren de un estímulo señal (o estímulo
desencadenante).
EJEMPLO: Respuesta de picotear a un punto rojo del pico del progenitor en crías de gaviotas.
Timbergen y Perdeck (1950) se preguntan qué provoca esta respuesta → ESTÍMULO SEÑAL
¿Qué rasgos del estímulo desencadenante son los que inician la respuesta de la pauta de acción
modal (PAM)?
-2-
RESPUESTA REFLEJA
RESPUESTA REFLEJA (“CONDUCTAS INVOLUNTARIAS”)

− Se activan automáticamente en presencia de un estímulo (E) concreto. Ej: Retirar la mano del
foco cuando nos quemamos.
− Está sujeta a mecanismos fijos: ARCO REFLEJO
Un reflejo es una respuesta automática ante un determinado estímulo. Esta conducta es causada por
conexiones fijas innatas en el sistema nervioso. Ej: Reflejo de succión.
ARCO REFLEJO:
Reflexología o estudio del comportamiento reflejo: Sechenov (1829 – 1905); Ivan P. Paulov (1849 –
1936).
“Un reflejo es un patrón estereotipado de movimientos de una parte del cuerpo que puede ser
provocado por la presentación del estímulo adecuado”
Algunos reflejos desaparecen con la edad, mientras que otros se mantienen

durante toda la vida.
Conexión innata ente las neuronas SENSORIALES (aferentes) y las neuronas

MOTRICES (eferentes): ARCO REFLEJO. Ej: Respuesta de salivación.
El reflejo nos permite responder inmediatamente a los estímulos (E’s) del entorno.
Así recuperamos el equilibrio del organismo. Son una respuesta correctora a un desequilibrio que se
haya producido.
-3-
APRENDIZAJE
El APRENDIZAJE, por el contrario, permite ANTICIPAR aquellas situaciones en las que el organismo
saldrá del ESTADO DE EQUILIBRIO y actúa antes, previniendo el DESEQUILIBRIO que se puede
producir.
El aprendizaje tiene limitaciones dado que requiere de un entorno estable y conocido, y no siempre
se dan estas condiciones.
Por tanto, hace falta además un MECANISMO DE AUTOCONTROL (no necesariamente voluntario).
Entonces, ¿por qué la psicología del aprendizaje se interesa por los reflejos?
− Porque muchas conductas son derivaciones, extensiones o variaciones de la conducta innata.

− Porque algunas conductas aprendidas tienen paralelismos con la conducta innata, como que
pueden estar controladas por el entorno o sus mecanismos de secuenciación temporal.
No siempre que se presenta un estímulo se desencadena una respuesta con la misma intensidad. La
conducta refleja se puede modificar a partir de la experiencia y estará influenciada por la adaptación
y sensibilización. Ej: Hacer apnea en la piscina.
DEFINICIONES DE APRENDIZAJE:
→ El aprendizaje es un cambio en la conducta, relativamente permanente, que se produce como

resultado de la experiencia con los acontecimientos del medio.
Aprendizaje ≠ cambio de conducta → comportamiento ante un semáforo en verde
→ El aprendizaje es un cambio inferido (no lo podemos observar directamente, sino que solo
podemos suponerlos a partir de la conducta manifestada) en el estado mental de un
organismo, como consecuencia de la experiencia e influencia de manera relativamente
permanente en el potencial del organismo para la conducta adaptativa posterior.
El psicólogo Donald O.Hebb (1949) realizó una importante contribución en las neurociencias:
Teoría sobre como el aprendizaje está mediado por cambios estructurales en las sinapsis → Según
la teoría, cuando un axón de una neurona “A” se encuentra suficientemente cerca para estimular
una neurona “B”, algunos cambios que suceden en la primera neurona “A” incrementan la
actividad de estimular la neurona “B”.
-4-
El aprendizaje:
− Provoca cambios en la mente
− Desarrolla nuevas asociaciones
− Debilita o potencia las asociaciones existentes
− Se reflejará en la conducta solo cuando sea necesario
El aprendizaje asociativo está basado en la vinculación en el espacio y el tiempo de dos hechos (en
su relación de contingencia).
Las asociaciones que dan lugar al condicionamiento se dan debido a la contigüidad o proximidad
temporal y espacial. Ej: una cosa pasa justo después de la otra en el mismo lugar.
→ “… es muy provechosos que el condicionamiento sea la adquisición del conocimiento sobre las
relaciones entre acontecimientos y que la mejor forma de considerar el cambio en la conducta
que registra el experimentador es a modo de índice de este conocimiento”.
Aprendizaje = Conocimiento
Conducta = Reflejo del conocimiento adquirido
→ “… el aprendizaje tiene que caracterizarse como la formación de una representación de las

relaciones existentes entre diferentes hechos o acontecimientos del ambiente del animal”
APRENDIZAJE PREASOCIATIVO
HABITUACIÓN Y SENSIBILIZACIÓN
Eric Kendel continuó los trabajos de Hebb y descubrió las bases sinápticas del aprendizaje. Descubrió
que, durante el aprendizaje, la actividad conjunta de dos neuronas las enlazaba.
Para sus experimentos utilizó el caracol marino Aplysia Californica. Cuando se siente amenazada, la
Aplysia activa un reflejo de protección de sus partes más vulnerables (la branquia, el sifón y la cola.
Estimulando al caracol con diferentes intensidades,

producían cambios en el comportamiento reflejo.
Kandel descubrió el rol de las sinapsis en dos tipos de aprendizajes: la HABITUACIÓN y la

SENSIBILIZACIÓN.
-5-
▪ HABITUACIÓN: Es aquel comportamiento de aprendizaje en el que una respuesta declina con la
presencia repetida del estímulo.
En el caracol, la respuesta de protección disminuía ante la estimulación repetida con un rayo de
agua (habituación) → Durante la habituación, la sinapsis cambia. Disminución del influjo de
calcio (Ca2), que reducía la liberación del neurotransmisor → Reducía la despolarización de la
membrana postsináptica.
▪ SENSIBILIZACIÓN: Es el comportamiento de aprendizaje en el que la respuesta se incrementa

ante la presencia continuada del estímulo. Generalmente se debe a que el estímulo en nuevo o
más fuerte que de normal.
En el caracol, el reflejo de protección se incrementaba ante la presentación repetida de
descargas eléctricas (sensibilización) → Durante la sensibilización, la sinapsis cambia. La
serotonina reducía el flujo de K+, incrementando la duración del potencial de acción. Al mismo
tiempo, este potencial incrementaba el flujo de calcio, que incrementaba la liberación del
neurotransmisor → Incrementaba la despolarización de la neurona postsináptica.
La HABITUACIÓN es la tendencia a dejar de responder ante un estímulo que se presenta

repetidamente sin consecuencias.
La SENSIBILIZACIÓN es la tendencia a incrementar nuestras respuestas ante un estímulo que se

presenta reiteradamente.
-6-
En relación al comportamiento, a menudo se produce un PATRÓN BIFÁSICO que se expresa mediante
una SENSIBILIZACIÓN INICIAL seguida de una RESPUESTA DE HABITUACIÓN.
Ambos, habituación y sensibilización, son el resultado final de procesos que nos ayudan a organizar
nuestra conducta en un entorno con gan cantidad de estímulos.
Ejemplos de estudios:
− Experimento de Swithers-Mulvey, Miller y Hall (1991) → Respuesta de consumo ante una

infusión de agua y azúcar en crías de rata. Los animales incrementaban el tiempo de consumo
durante la segunda presentación respeto al de la primera, pero a partir de la tercera la
respuesta de consumo duraba menos tiempo.
− Experimento de Espstein, Rodefer, Wisniewki i Caggiula (1991) → Respuesta de salivación al
gusto del limón en un grupo de 8 mujeres. Incrementaba en los ensayos 1 y 2, y a partir de
aquí disminuía.
DISTINCIÓN ENTRE HABITUACIÓN Y…
▪ ADAPTACIÓN SENSORIAL: Se da cuando los órganos sensoriales pierden temporalmente la

sensibilidad debido a una determinada estimulación.
Ej: Cuando algo nos ensordece, perdemos temporalmente la capacidad de escuchar →
hipoacusia temporal.
▪ FATIGA: Se da cuando los músculos pierden la capacidad de responder debido a un ejercicio

mantenido en el tiempo. Después del descanso se recupera la intensidad de la conducta.
Una característica de la habituación es que, a diferencia de la adaptación sensorial y la fatiga, es

específica del estímulo. Ej: Nos podemos haber habituado al sonido que hace la nevera por la
noche, pero nos podemos despertar por el llanto del bebé que duerme en la habitación de al lado.
CARACTERÍSTICAS DE LA HABITUACIÓN:
− Tiene un carácter específico respecto al estímulo que se presenta repetidamente.

− En ocasiones se observa generalización entre estímulos si estos son semejantes.
− Si después de darse la habituación se expone al sujeto a un estímulo nuevo, al volver a
presentar el estímulo habituado se observa que la respuesta vuelve a aparecer
− Esta reversibilidad de la habituación producida por una nueva estimulación recibe el nombre
de DESHABITUACIÓN.
− La definición de Deshabituación sería: Proceso de sensibilización que incrementa la respuesta
del individuo a responder, incluso ante el estímulo habituado.
− La recuperación de la respuesta habituada debido exclusivamente al paso del tiempo se llama
RECUPERACIÓN ESPONTÁNEA.
− La respuesta de Recuperación Espontánea no siempre es completa. Por tanto, podemos
afirmar que se producen efectos a largo plazo en el proceso de habituación.
-7-
CARACTERÍSTICAS DE LA SENSIBILIZACIÓN:
− La Sensibilización es un proceso de poca duración.

− Un factor a tener en cuenta es la intensidad del estímulo → Los estímulos intensos provocan
mayor tendencia a responder y un proceso más persistente.
− En general, si desaparece el estímulo, la respuesta incrementada (o sensibilización) decrece o
desaparece rápidamente (excepto algunos casos puntales).
− La Sensibilización NO es específica del estímulo (la tendencia a incremental la respuesta se
produce ante estímulos diferentes)
La Habituación y la Sensibilización son dos fenómenos que representan cambios en la conducta como
consecuencia de la experiencia de un individuo en relación a un estímulo que se presenta
repetidamente. En este sentido lo podemos considerar un APRENDIZAJE SIMPLE o PREASOCIATIVO.
TEORÍAS DE LA HABITUACIÓN Y SENSIBILIZACIÓN:
1. TEORÍA DUAL DE LA HABITUACIÓN Y LA SENSIBILIZACIÓN. (Groves y Thompson, 1970)
Existen dos procesos naturales (Habituación y Sensibilización) que NO son excluyentes y que
pueden activarse simultáneamente.
El resultado neto es la resta entre los procesos → ganará aquel proceso (habituación o
sensibilización) que se active con más fuerza.
Según los autores de la teoría, el proceso de Habituación estaría relacionado con el Sistema E-R
(arco reflejo), mientras que el segundo proceso, el de Sensibilización, se relacionaría con el
llamado Sistema de Estado, en el que estarían implicadas otras partes del sistema nervioso. El
Sistema de Estado puede verse afectado por las drogas o los estados emocionales como el
miedo.
Ej: En el caracol marino Aplysia una estimulación repetida hace disminuir la cantidad de
neurotransmisor en las sinopsis.
-8-
2. TEORÍA DEL PROCESO OPONENTE. (Solomon y Corbi, 1974)
▪ El Proceso A se activa inmediatamente después de la presentación de un estímulo → Este
Proceso A se puede entender como un estado emocional directamente relacionado con la
calidad motivacional del estímulo. (Ej: Una descarga eléctrica genera miedo, un estado
fisiológico asociado que se expresa, entre otras manifestaciones, con un incremento de la
tasa cardiaca)
▪ El Proceso B se activa también a partir de la presentación del estímulo, pero actúa de forma
más lenta → Se opone al Proceso A y hace disminuir la reactividad del estímulo.
La teoría asume que, una vez el estímulo deja de presentarse, el Proceso A desaparece
inmediatamente, pero el Proceso B sigue actuando un tiempo más.
Ej de las drogas: Proceso A → Estado placentero Proceso B → Reacciones adversas.
Primeras estimulaciones Después de muchas estimulaciones

-9-
3. TEORÍAS COGNITIVAS DE LA HABITUACIÓN. (Wagner, 1978, 1981; Sokolow, 1963; Konorski,
1967)
Son todas aquellas teorías relacionadas con la Memoria.
El Registro Sensorial envía el Estímulo a un almacenamiento a Corto Plazo formado por la

memoria a corto plazo (que contiene información de acontecimientos recientes) y un
procesador (mecanismo de repaso que procesa constantemente los estímulos de entrada). El
acceso al almacén está controlado por un Comparador (compara el contenido del registro
sensorial con los que están activados en la MCT y sólo deja pasar los registros que son nuevos y
las representaciones de los que no están activadas en la MCT).
- 10 -
TEMA 2: CONDICIONAMIENTO CLÁSICO
DEFINICIÓN DE APRENDIZAJE:
"El Aprendizaje es un cambio inferido en el estado mental de un organismo, el cual es una

consecuencia de la experiencia e influye de manera relativamente permanente en el potencial del
organismo para la conducta adaptativa posterior."
APRENDIZAJE ASOCIATIVO
El aprendizaje asociativo está basado en la vinculación en el espacio y el tiempo de dos hechos (en
su relación de contingencia).
Las asociaciones que dan lugar al condicionamiento se dan debido a la contigüidad o proximidad
temporal y espacial. Ex: algo pasa justo después de la otra en el mismo lugar.
Dos tipos de aprendizaje asociativo: el condicionamiento clásico y el condicionamiento instrumental.
CONDICIONAMIENTO CLÁSICO
El Condicionamiento Clásico es uno de los mecanismos de aprendizaje más sencillos.
Mediante este proceso los organismos aprendemos a dar:

− Respuestas nuevas a los estímulos
− Somos capaces de determinar las relaciones existentes entre ellos (Domjan y Bukhard, 1953)
− Somos capaces de anticipar la aparición de los estímulos
El Condicionamiento Clásico permite a los organismos predecir la secuencia de eventos que es

probable que se produzca y, a partir de este conocimiento, poder actuar dando respuestas nuevas,
mejorando así su adaptación al entorno.
Podemos considerar a John Locke y David Hume precursores de los planteamientos del Condicionamiento
Clásico.
“Las experiencias se originan en los sentidos, y estas experiencias se ASOCIAN entre sí para formar nuestro
conocimiento del mundo”
Paulov (finales s.XIX) adopta el principio de Asociación entre Estímulos y la aplica a la investigación
científica del aprendizaje.
- 11 -
MODELO DE CONDICIONAMIENTO CLÁSICO PAULOVIANO
Pavlov observó que una respuesta o reflejo incondicionado (salivación, la succión, la respiración…)
también se podía observar ante un evento o estímulo distinto al que la provoca de forma innata.
El condicionamiento clásico se produce por la asociación de dos estímulos que tienen una contigüidad
temporal: uno que produce una respuesta innata y otro que no la produce (estímulo neutro).
TERMINOLOGÍA:
▪ Estímulo Incondicionado (EI): Es el acontecimiento o estímulo que provoca espontáneamente

la Respuesta Incondicionada (RI). Esta respuesta es innata o heredad, es decir, no ha sido
aprendida previamente.
▪ Estímulo Neutro (EN): Estímulo que no provoca ningún tipo de respuesta en el sujeto
(Respuesta Neutra -RN-).
▪ Estímulo Condicionado (EC): Es el nuevo estímulo que era neutro y que se ha asociado al
reflejo/respuesta incondicionada, pasando a provocar una Respuesta Condicionada (RC). Este
estímulo puede ser cualquier elemento que mantenga una relación de contingencia con el EI.
- 12 -
SOBRE LOS ESTÍMULOS:
Algunos estímulos son eficaces cuando los utilizamos como EC, en tanto que otros necesariamente
funcionan como EI.
Que un EC o un EI sean efectivos para generar aprendizaje depende en parte de que sean nuevos o
causen sorpresa en el sujeto.
Los estímulos familiares NO suelen provocar respuestas tan intensas, la atención prestada es menor
y, por tanto, se produce menos aprendizaje o tarda más en producirse.
Por lo general, los estímulos intensos se condicionan antes que los débiles. Con todo, si la intensidad
del EC o del EI es excesiva, el aprendizaje puede verse dificultado.
La asociación entre EC y EI debe ser relevante o pertinente. Es decir, hay estímulos que se asocian
más fácilmente entre sí que otros. Esto está relacionado con cómo se asocian los estímulos en el
medio natural (Ej: El malestar se asocia más a EC gustativos y, en cambio, el dolor de las descargas
eléctricas a EC audiovisuales).
Los EC provocan inicialmente respuestas menos intensas en los organismos que los EI.
Los EI tienen más fuerza biológica.
FORMAS DE LLAMAR A LOS ESTÍMULOS SEGÚN SUS CARACTERÍSTICAS:
▪ Estímulo NEUTRO: Es aquel estímulo que inicialmente NO provoca ninguna respuesta en el

organismo y que acaba provocando una Respuesta Condicionada después de varias sesiones
de entrenamiento. Entonces se llama Estímulo Condicionado (EC).
▪ Estímulo APETITIVO: Es aquel estímulo que provoca consecuencias agradables en el sujeto (EI).
▪ Estímulo AVERSIVO: Es aquel estímulo que provoca consecuencias desagradables en el sujeto
(EI).
▪ Estímulo SEÑAL, DESENCADENANTE o ELICITANTE: Es aquel estímulo que provoca una
respuesta innata en el organismo (EI).
▪ Estímulo RETROALIMENTADOR: Es aquel estímulo que ha sido provocado como consecuencia

de una respuesta realizada por el sujeto.
Ej: Estornudo → La nariz deja de picarnos (El estímulo retroalimentador es la información de
que la molestia que ha provocado el estornudo ha desaparecido).
▪ Estímulo PROPIOCEPTIVO: Es aquel estímulo retroalimentador cuya información proviene del
propio organismo.
Ej: Sensación de hambre o de sed.
▪ Estímulo DISCRIMINATIVO: Es aquel estímulo que señala cuando está presente y cuándo NO
está disponible el reforzamiento (E+ o ED indica que SÍ está disponible; E- o ER (delta) indica
que NO está disponible).
- 13 -
FASES DEL CONDICIONAMIENTO CLÁSICO:
➢ 1ª FASE:
En esta fase está presente el Estímulo Incondicionado (EI), que provoca una Respuesta
Incondicionada (RI), que es una respuesta innata o heredada que NO ha sido aprendida
previamente.
Ejemplos:
− Comida (EI) provoca respuesta de Salivación (RI).
− Aire en la cara (EI) provoca Parpadeo (RI).
− Pinchazo (EI) provoca Retirar el brazo (RI).
− Sonido fuerte (EI) provoca Lloro en el bebé (RI).
En esta fase también encontramos Estímulos Neutros (EN), que provocan una Respuesta Neutra
(RN).
Ejemplos:
− Campanilla (EN) NO provoca respuesta de Salivación (RI).
− Gota de agua (EN) NO provoca Parpadeo (RI).
− Olor de comida (EN) NO provoca Retirar el brazo (RI).
− Juguete (EN) NO provoca Lloro en el bebé (RI).
➢ 2ª FASE:
En esta fase se presentan Estímulos Neutros (EN) inmediatamente después del Estímulo
Incondicionado (EI), de forma que se genera la Respuesta Incondicionada (RI).
El EN, que pasará a ser el Estímulo Condicionado (EC), y el EI se pueden presentar con diferentes
patrones temporales (al mismo tiempo, uno antes que el otro, uno cuando el otro ha finalizado,
de forma aleatoria…)
Esquema de esta 2ª fase: EN + EI (que provoca la RI).

Ejemplos:
− Campanilla (EN) + Comida (EI) que provoca respuesta de Salivación (RI).
− Gota de agua (EN) + Aire en la cara (EI) que provoca Parpadeo (RI).
− Olor de comida (EN) + Pinchazo (EI) que provoca Retirar el brazo (RI).
− Juguete (EN) + Sonido fuerte (EI) que provoca Lloro en el bebé (RI).
➢ 3º FASE:
Esquema de esta 3ª fase: El Estímulo Condicionado (EC) – anterior Estímulo Neutro (EN) – pasa
a generar la Respuesta Condicionada (RC).
Ejemplos:
− Campanilla (EC) provoca respuesta de Salivación (RI).
− Gota de agua (EC) provoca Parpadeo (RI).
− Olor de comida (EC) provoca Retirar el brazo (RI).
− Juguete (EC) provoca Lloro en el bebé (RI).
- 14 -
EJERCICO: CONDICIONAMIENTO CLÁSICO
EJERCICIO 1: Describe el proceso de condicionamiento clásico responsable de lo que le pasa a Mireia

y pon nombre a: EI, RI, EC, RC. Explica sus fases. (Explicación del caso en el folio).
➔ FASE 1:
− EI = Agresión sexual provoca RI = Miedo
− EN = Noche/Hombres provoca RN = Estado normal
➔ FASE 2: EN (Noche/hombre) + EI (agresión sexual) = RI (Miedo)
➔ FASE 3: EC (salir de noche/ver hombres) provoca RC (miedo)
EJERCICIO 2:
a) Alguien recibe una mala noticia en el momento en el que entraba en el metro y se siente muy
agobiado por la mala noticia. Al cabo de unos días cuando vuelve a entrar en el metro nota
agobio.
➔ FASE 1:
− EI = Mala noticia provoca RI = Agobio
− EN = Entrar al metro RN = Estado normal
➔ FASE 2: EN (entrar al metro) + EI (mala noticia) = RI (agobio)
➔ FASE 3: EC (entrar al metro) provoca RC (agobio)
b) Una persona come muchas cerezas y tiene una indigestión. Ahora cada vez que siente hablar de
cerezas se le revuelve el estómago.
➔ FASE 1:
− EI = Empacho provoca RI = Indigestión malestar
− EN = Ciruelas RN = Estado normal
➔ FASE 2: EN (empacho) + EI (ciruelas) = RI (indigestión malestar)
➔ FASE 3: EC (ciruelas) provoca RC (dolor de estómago/malestar)
- 15 -
c) En el colegio no todos los niños salen al patio en el mismo momento. En 1º cuando suena el
timbre los del grupo A se van al patio y los del grupo B van a psicomotricidad, donde se estiran
en el suelo en circulo y se relajan. Explica el proceso para los del grupo A y los del Grupo B cuando
suena el timbre.
GRUPO A:
➔ FASE 1:
− EI = irse al patio provoca RI = activación
− EN = sonar el timbre provoca RN = Estado normal
➔ FASE 2: EN (timbre) + EI (irse al patio) = RI (actuación)
➔ FASE 3: EC (timbre) provoca RC (activación)
GRUPO B:
➔ FASE 1:
− EI = Psicomotricidad sexual provoca RI = relajación
− EN = sonar el timbre provoca RN = Estado normal
➔ FASE 2: EN (timbre) + EI (psicomotricidad) = RI (relajación)
➔ FASE 3: EC (timbre) provoca RC (relajación)
d) Un niño ve una película de miedo en su habitación y ahora cada vez que entra a la habitación
tiene miedo.
➔ FASE 1:
− EI = película de miedo provoca RI = Miedo
− EN = habitación provoca RN = Estado normal
➔ FASE 2: EN (habitación) + EI (película de miedo) = RI (Miedo)
➔ FASE 3: EC (habitación) provoca RC (miedo)
e) Una pareja se conoce mientras suena una canción concreta. Ahora cada vez que oyen la canción
sienten una emoción especial.
➔ FASE 1:
− EI = Conocerse provoca RI = emoción especial
− EN = Canción provoca RN = Estado normal
➔ FASE 2: EN (canción) + EI (conocerse) = RI (emoción especial)
➔ FASE 3: EC (canción) provoca RC (emoción especial)
f) Qué crees que pasa cando le enseño la correa a mi perro (le pongo la correa cada vez que salimos
a la calle).
➔ FASE 1:
− EI = Salir a la calle provoca RI = alegría por salir
− EN = correa RN = Estado normal
➔ FASE 2: EN (correa) + EI (salir a la calle) = RI (alegría)
➔ FASE 3: EC (correa) provoca RC (alegría por salir)
- 16 -
El Condicionamiento Clásico ha sido estudiado en diversos ámbitos: relaciones personales, trabajo,
educación, adicción a sustancias, psicopatologías... y en un gran número de especies animales:
monos, perros, gatos, aves… sobre todo con ratas, conejos y palomas.
PROCEDIMIENTOS EXPERIMENTALES:
Algunos procedimientos experimentales empleados en el estudio del condicionamiento clásico:

− Parpadeo
− Seguimiento de signos
− Aversión condicionada
− Miedo condicionado
➢ El condicionamiento del PARPADEO (años 60) – Gormezano y colaboradores –:
Reflejo de parpadeo con conejos albinos (aire o leve descarga eléctrica sobre el tercer párpado
o membrana nictitante).
Fueron necesarios cientos de ensayos antes de que se produjera condicionamiento.
Dificultad alta para el condicionamiento.
➢ El SEGUIMIENTO DE SIGNOS o AUTOMOLDEAJE (Brown y Jenkins, 1968):
Se da cuando un EC señala de forma consistente la presentación de un EI.
Estudiado con palomas. Esta especie golpea con el pico lo que le indica que ahí hay comida.
Otras especies también se acercan a la comida por el olfato, ruidos o movimientos.
Estímulos luminosos – tecla – (EC) y comida (EI).
Dificultad de adquisición del condicionamiento: Intermedia (en torno a 35 – 40 ensayos).
Se relaciona con la tendencia de muchos animales a acercarse y contactar con los estímulos que
informan de la disponibilidad de comida (Domjan y Bukhard, 1993).
➢ La AVERSIÓN condicionada al gusto
EC (sabores nuevos → Ej: H2O y sacarina, o jarabes de varios gustos sin efectos).
EI (sustancia que hace enfermar o encontrarse mal → Ej: Inyecciones de ClLi o ciclofosfamida
que provocan náuseas; exposición intensa a los rayos X)
Se puede dar una fuerte asociación en un solo ensayo de aprendizaje, lo que demuestra que se
trata de un aprendizaje muy importante para la supervivencia (Ej: Un veneno).
El aprendizaje puede producirse aunque pasen varias horas entre la ingesta de un nuevo sabor
y la aparición de los efectos negativos (Ej: Algunos venenos tardan horas o incluso días en hacer
efecto sobre el organismo).
Ejemplo: Aversión al pastel de chocolate si lo comes estando malo y te duele la barriga.
- 17 -
➢ Condicionamiento del MIEDO:
También llamado Respuesta Emocional Condicionada.
Estes y Skinner con ratas (1941).
Parálisis como expresión de miedo frente a determinados estímulos aversivos o amenazantes,

en ratas y en otras especies.
El estímulo aversivo suele ser una descarga eléctrica en las patas y el EC un tono o luz que se
enciende cuando se va a producir la descarga eléctrica.
EC Sensorial (sonido, luz)

…………………………………………………………………… EC
Contextual
EI …………………………………………………………………… EI Descarga eléctrica
Tiempo
La aparición del miedo acondicionado se consigue con unos 3 – 5 ensayos.
La medida indirecta del miedo se realiza por medio de la Razón de Supresión (medida
cuantitativa del grado de supresión de la conducta del sujeto, es decir, la medida indirecta del
miedo que el sujeto experimenta frente al nuevo estímulo).
Respuestas al EC
Razón de supresión =
Respuestas al EC + Respuestas que el sujeto daba antes de la aparición del EC
El valor de la Razón de Supresión varía entre 0 (parálisis absoluta) y 0.5 (nada de miedo).
PRESENTACIÓN TEMPORAL DE LOS ESTÍMULOS:
El Estímulo Neutro (EN) se suele presentar antes que el Estímulo Incondicionado (EI).
La relación temporal entre EC y EI puede ser de diversos tipos.
Hay que distinguir entre CONTIGUIDAD y CONTINGENCIA
CONTIGÜIDAD Y CONTINGENCIA:
CONTIGÜIDAD: La relación entre dos estímulos que se presentan JUNTOS en el tiempo (no es
condición suficiente para que se produzca condicionamiento).
La mayor cantidad de aprendizaje se produce cuando el EC se presenta un poco antes de la

aparición del EI.
También puede existir asociación entre EC y EI cuando hay una separación temporal entre la
presentación de ambos estímulos de horas o incluso de días. Esta cuestión ha hecho plantear que
la condición clave en el Condicionamiento Clásico es el hecho de que la relación entre EC y EI sea la
de que el EC debe suponer un buen predictor de la aparición de la EI (CONTINGENCIA).
- 18 -
La relación entre la aparición del EC y la aparición posterior del EI NO siempre es una cuestión de
TODO o NADA.
La capacidad del EC de predecir EI dependerá de la cantidad de veces que EC aparezca antes que el
EI y de la cantidad de veces que el EI aparezca por separado (Rescorla, 1967).
Algunos EC predicen la NO presentación del EI. Esta situación se llama ACONDICIONAMIENTO

CLÁSICO INHIBITORIO.
Las relaciones entre los EC y los EI seguirían la Ley de la Probabilidad: la relación entre ellos NO
vendría dada por el Principio de Contigüidad sino por el PRINCIPIO DE CONTINGENCIA.
Definición de CONTINGENCIA: es la relación entre dos probabilidades:
1. La probabilidad de que el EC se presente al mismo tiempo que el EI o P(EI / EC)

2. La probabilidad de que el EI se presente en ausencia del EC o P(EI / no EC)
CONTINGENCIA = P(EI / EC) – P(EI / no EC)
Los Valores de Probabilidad se mueven entre 0 y 1 y, por tanto, los valores de contingencia pueden
variar entre +1 y -1.
▪ Condicionamiento clásico excitador: El EC predice la ocurrencia del EI.

P(EI / EC) > P(EI / no EC)
▪ No condicionamiento: No existe relación entre el EC y el EI.
P(EI / EC) = P(EI / no EC)
▪ Condicionamiento clásico Inhibitorio: El EC predice la NO ocurrencia del EI
P(EI / EC) < P(EI / no EC)
Tabla y fórmulas para saber la Relación de Contingencia entre 2 estímulos:
EI No EI 𝑎 𝑐
P(EI / EC) = P(EI / no EC) =
EC a b 𝑎+𝑏 𝑐+𝑑
No EC c d
El aspecto clave del Modelo de Contingencia entre EC y EI será que el emparejamiento entre ambos
estímulos NO es suficiente para que se produzca condicionamiento clásico, sino que ES NECESARIO
que el EC sea un BUEN PREDICTOR de la aparición del EI (Condicionamiento Clásico Excitador) o de
la NO aparición del EI (Condicionamiento Clásico Inhibitorio)
PROCEDIMIENTOS TÍPICOS DEL CONDICIONAMIENTO CLÁSICO:
➢ Condicionamiento SIMULTÁNEO:
El EI y el EC se presentan al mismo tiempo y con la misma duración de presentación.
Este procedimiento produce asociación, pero en menor

cantidad que en los procedimientos de Demora y de Huella.
- 19 -
➢ Condicionamiento de DEMORA:
En este procedimiento el EC se presenta un poco antes que el EI. Además, el EI aparece antes
de que el EC haya desaparecido.
1. De Demora Corta: El EI se presenta poco después de la aparición del EC (el procedimiento

más frecuente).
2. De Demora Larga: El EC está presente mucho tiempo antes de que se presente el EI. El EC
puede estar expuesto entre 5 y 10 minutos antes de que aparezca el EI.
➢ Condicionamiento de impronta o HUELLA:
Es similar al anterior, aunque no tan efectivo, ya que a medida que se incrementa el Intervalo
de Huella va decayendo la intensidad del condicionamiento. En este caso se presenta primero el
EC, pero el EI NO se presenta hasta que el EC ha desaparecido un tiempo antes.
Ej: Las lluvias en otoño (EC) nos indican que 21 días después puede que salgan setas (EI), por
tanto, la RI sería ir a buscar setas y la RC sería ir 21 días después de que haya llovido.
➢ Condicionamiento hacia ATRÁS:
El EI se presenta antes de que aparezca el EC.
El EC informa de la finalización del EI.
Es útil, en ocasiones, para la formación de Condicionamiento Clásico Inhibitorio (Tarpy, 2000) y

en ocasiones, también para el Condicionamiento Clásico Excitador.
Se consigue una asociación del EC y del EI en un 50% de las veces después de 4 sesiones de
entrenamiento.
El mayor aprendizaje siempre se da con el procedimiento de Demora.
- 20 -
OTROS PROCEDIMIENTOS DE CONDICIONAMIENTO CLÁSICO:
➢ Condicionamiento ALEATORIO:
Los EC y los EI se presentan de forma aleatoria de forma que a veces coinciden y otras no. Las
contingencias se dan al azar.
El valor de contingencia será 0 o valores muy cercanos.
Los condicionamientos simultáneo, hacia atrás y aleatorio NO permiten que el sujeto prediga la
aparición del EI, por lo que son los que menos condicionamiento producen.
➢ Condicionamiento TEMPORAL:
Se presenta únicamente el EI a intervalos regulares.
Se genera un EC implícito, que es el tiempo.
Hacen falta muchos ensayos para asociar el EC y el EI. Ej: Poner el despertador a la misma hora.
FENÓMENOS BÁSICOS DEL CONDICIONAMIENTO CLÁSICO:
➢ La ADQUISICIÓN:
Se produce durante la fase de FORMACIÓN del Condicionamiento Clásico.
El Estímulo Neutro (EN) se convierte en Estímulo Condicionado (EC) → que genera una
Respuesta Condicionada (RC)
Curva típica de la adquisición del Condicionamiento Clásico:
Fuerza de la Rc
Ensayos de asociación Ec y Ei
Los mayores incrementos se dan en los primeros ensayos.
Llega un momento en el que la curva es asintótica.
➢ La EXTINCIÓN:
Se produce cuando, una vez el EN se ha convertido en EC, y este lleva una tasa estable de RC,
dejamos de emparejar EC con el EI. La fuerza de la RC se irá debilitando poco a poco, llegando
incluso a desaparecer.
Curva típica de la extinción del Condicionamiento Clásico:

Fuerza de la Rc
- 21 -
Ensayos de asociación Ec y Ei
La extinción es, y ha sido empleada en gran medida en el ámbito clínico por medio de la
Modificación de Conducta.
Ej: Tratamiento de las fobias.
No todas las RC se extinguen de la misma forma. En general, cuanto más fuerte sea la RC, más
costará extinguirla.
➢ La RECUPERACIÓN ESPONTÁNEA:
Hemos condicionado un Estímulo y seguidamente lo hemos extinguido. Después de una pausa

de unos días es muy probable que nos encontremos que el EC vuelva a generar la RC. A este
fenómeno lo llaman Recuperación Espontánea.
Cuando aplicamos Técnicas de Modificación de Conducta es frecuente que se produzcan

recaídas y retrocesos, a medida que la persona va mejorando en el tiempo.
Ej: Miedo a las batas blancas.
Desarrollo temporal de los procesos de adquisición, extinción y recuperación espontánea en el

condicionamiento clásico:
Recuperación Espontánea
Fuerza de la Rc
Adquisición Extinción Pausa Extinción

(Ec – Ei) (Ec solo) (intervalo de (Ec solo)
tiempo sin
presentar el Ec)
➢ La GENERALIZACIÓN y la DISCRIMINACIÓN:
Estímulos muy DIFERENTES pueden ser catalogados de IGUAL forma y estímulos muy IGUALES
pueden ser categorizados de manera DIFERENTE.
Ej: Agorafobia o fobia a los perros (cachorros).
▪ GENERALIZACIÓN: Tendencia a responder de la misma manera ante estímulos parecidos al

EC.
▪ DISCRIMINACIÓN: Tendencia a responder de forma diferente ante estímulos parecidos al
EC.
- 22 -
Cuanto más parecidos son los estímulos:
− Más fácil es la Generalización
− Más difícil es la Discriminación
− (Y viceversa)
Experimento de Guttman y Kalish (1956) con palomas y colores (cambiando progresivamente la

longitud de onda y observando cómo cambiaba la RC).
La disminución progresiva de las respuestas se llama GRADIENTE de GENERALIZACIÓN. La

pendiente del gradiente de generalización nos indica la importancia (alta o baja) de aquella
característica en relación a la RC.
El estudio de los gradientes de generalización nos permite conocer hasta qué punto una
característica de un estímulo (Ej: el volumen, el color o la textura) es importante en la regulación
de la conducta de un sujeto.
Distribución típica de los Gradientes de Generalización (Experimento de Guttman y Kalish, 1956).
EJERCICIO: CONDICIONAMIENTO CLÁSICO
EJERCICIO 3: Identifica si en los siguientes casos se producen generalización, discriminación, extinción

o recuperación espontánea. (enunciados en la hoja)
− El enfermero Manel lleva una bata verde, Albert tiene que ir a pincharse cuatro veces por
semana. Pasados unos meses, Albert se siente inquieto cuando tiene que comer alimentos que
son de color verde como las judías, brócoli… → (Adquisición) + Generalización
− Cada día que Abril entra en el horno de pan de debajo de casa a comprar el pan la tendera le
regala un caramelo. En verano pasó unos días en casa de su abuela en otro pueblo y le hizo la
boca agua cuando entraba a comprar el pan, hecho que no le pasa cuando entra en la carnicería
- 23 -
o pescadería ni otro establecimiento → Generalización (a las panaderías) + Discriminación (con
el resto de las tiendas)
− Llora un bebé y la abuela lo coge en brazos para calmarlo, pero no lo consigue. El bebé se calma
cuando le coge en brazos la madre → Discriminación
− Alguien tuvo una intoxicación alcohólica tomando ron y, desde entonces, no ha vuelto a probar
el ron ni ninguna otra bebida alcohólica → Generalización
La Silvia y los perros: → Recuperación espontánea (con los perros de sus primos) + Discriminación
(con el perro de su amiga)
a) Adquisición
b) Generalización
c) Extinción
d) Discriminación
La Susana y el mar:
a) Adquisición
b) Extinción Olvido
c) Recuperación espontánea
d) Discriminación
e) Generalización
- 24 -
FENÓMENOS ESPECIALES DEL CONDICIONAMIENTO CLÁSICO:
Los fenómenos especiales del Condicionamiento Clásico son procedimientos de aprendizaje con
pequeñas variaciones de los procedimientos estándar.
➢ El CONTRACONDICIONAMIENTO:
En el Contracondicionamiento, en lugar de asociar un Estímulo Neutro (EN) con el EI, se asocia

un estímulo que provoca una respuesta diferente, incluso contraria, a la del EI.
Ej: Asociar un perro (EI que genera miedo) con un juego (EC que genera bienestar); Asociar
alcohol (EI de tipo apetitivo) con un fármaco que genera náuseas (EC de tipo aversivo).
1. EC (+) provoca una RC (+) → Juego que provoca bienestar.

2. EC – EI (-) provoca una RC (+) → Juego y perro (el juego provoca bienestar).
3. EC (-) provoca una RC (+) → El perro provoca bienestar.
➢ El condicionamiento de ORDEN SUPERIOR:
En este tipo de aprendizaje, un Estímulo puede actuar como EI después de haber estado
condicionado.
− 1ª FASE: En primer lugar, se produce un aprendizaje por condicionamiento clásico básico.

EN + EI que genera una RI  EC1 genera RC1 (condicionamiento de 1er orden)
− 2ª FASE: Después se empareja otro EN con el EC1 y el EN pasa a ser el EC2.
EN + EC1 que genera una RC1  EC2 genera RC2 (condicionamiento de 2ª orden)
Este procedimiento podría seguir una Fase 3 una Fase 4… Y entonces hablaríamos de
condicionamiento de 3er orden, de 4ª orden…
El dinero es un reforzador secundario que puede intercambiarse por reforzadores primarios o

bien por otros reforzadores secundarios que llamen más la atención.
RC1 > RC2 > RC3 > RC4
Este procedimiento permite aplicar el EC a un mayor número de situaciones, incluso aunque el

EI NO esté disponible, sea peligroso o perjudicial para el sujeto.
Se forman asociaciones sucesivas entre unos aprendizajes y otros
➢ El PRECONDICIONAMIENTO SENSORIAL:
El propósito es conseguir que un Estímulo Neutro (EN) se convierta en un EC sin haber sido
asociado a un EI.
− En primer lugar, se asocian dos Estímulos Neutros.

EN1 – EN2 (Ej: Una luz y un tono)
− A continuación, hechos algunos ensayos, se produce una asociación del EN2 con el EI
EN2 + EI (que provoca una RI)  EC2 provoca una RC2
- 25 -
Ej: Un tono + bola de comida, que provoca salivación  El tono provoca salivación
− Seguidamente, comprobamos que el EN1, ahora EC1 (luz), provoca una respuesta de
salivación o RC1.
La asociación previa entre 2 estímulos neutros es capaz de provocar un nuevo condicionamiento

en ausencia del EI (EC1 provoca RC1)
➢ El ECLIPSAMIENTO:
Se da cuando procuramos realizar un procedimiento de aprendizaje con 2 o más EC y uno de

ellos se asocia en mayor medida al EI. Por tanto, uno de ellos NO provoca ninguna RC o la provoca
con una intensidad muy débil.
1. EN1 + EN2 + EI (que provoca una RI)

2. EC1 provoca RC1 / EC2 NO provoca RC2
3. EC1 + EC2 provoca una RC1
En este procedimiento EC1 sería el Estímulo Eclipsador y EC2 el Estímulo Eclipsado.
El Eclipsamiento se puede producir por 2 motivos:

1. Cuando uno de los estímulos es más intenso que el otro.
2. Cuando uno de los estímulos tiene MAYOR RELEVANCIA CAUSAL (Ej: Si queremos asociar
un olor y un sonido a la comida, es más probable que el olor sea más relevante dado que
la comida ya suele hacer olor, pero no ruido)
Además, según la especie puede haber más predisposición biológica a asociar algunos estímulos
con otros. Tiene relación con el entorno natural de cada una.
➢ El BLOQUEO:
Se produce cuando hay un proceso de condicionamiento compuesto (hay 2 o más estímulos

para condicionar) y uno de ellos ya ha sido previamente condicionado, lo que dificulta el
condicionamiento del otro estímulo condicionado.
− 1ª FASE: EN1 + EI (que provoca una RI)  EC1 genera RC.

− 2ª FASE: EN2 + EN1 (que provoca una RC)  EC2 NO genera RC.
Ej: En condiciones naturales se presentan muchos estímulos. Es una ventaja poderse centrar en
aquellos estímulos que aportan mayor información e ignorar el resto. Si no funcionara el
mecanismo de inhibición, la atención iría cambiando constantemente de un estímulo a otro.
➢ La INHIBICIÓN LATENTE:
La presentación aislada de un estímulo antes de que se intente asociar a un EI provoca que la

asociación posterior sea más difícil.
− 1ª FASE: Estímulo Neutro (EN) solo.

− 2ª FASE: EN + EI (que provoca una RI).
− 3ª FASE: EC – antes EN – provoca un RC débil o inexistente.
- 26 -
Ej: Se pueden reducir las náuseas relacionadas con la quimioterapia administrada en un hospital
habiendo visitado el hospital con anterioridad en diversas ocasiones sin la experiencia de sufrir
náuseas.
La Inhibición Latente muestra una gran dependencia del contexto. Si el mismo estímulo se
presenta en un contexto diferente puede dejar de producirse la inhibición y darse.
➢ La IRRELEVANCIA APRENDIDA:
Se presentan un EC y un EI de forma NO correlacionada. Es decir, a veces se presenta uno, a

veces se presenta el otro, a veces ambos, sin seguir uno orden lógico Esta presentación previa
dificulta el aprendizaje posterior.
− 1ª FASE: EN // EI
− 2ª FASE: EN + EI (que provoca una RI).
− 3ª FASE: EC – antes EN – provoca un RC débil o inexistente.
CONDICIONAMIENTO CLÁSICO VICARIO:
No siempre tenemos que estar expuestos a los EC y a los EI para aprender las relaciones entre unos
y otros.
Gran parte de los aprendizajes se producen por observación.
CONDICIONAMIENTO CLÁSICO INHIBITORIO:
Cuando un EC permite predecir la NO presentación de un EI
− EI provoca una RI / EN No provoca una RI.

− EC – No EI (cuando se presenta el EC no se presenta el EI).
− EC – provoca la RC – (Respuesta Condicionada Inhibitoria).
Ej: Un niño aprende que cuando su padre se pone a ver la TV (EC), él NO irá al parque (EI). El niño no
insistirá en ir a jugar al parque y sacará sus juguetes en su habitación (RC).
Para que se dé un condicionamiento inhibitorio es necesario que haya un contexto excitador.
Existen dos procedimientos experimentales para provocar condicionamiento inhibitorio:

1. Procedimiento ESTÁNDAR o DISCRIMINACIÓN COMPUESTA:
Se presentaron al azar dos tipos de ensayos:
Ej: Semáforo y policía. Si el policía nos indica que pasemos con el semáforo en rojo sabemos que
NO nos multarán.
- 27 -
2. Procedimiento de INHIBICIÓN DIFERENCIAL.
Este procedimiento genera menor condicionamiento que el procedimiento anterior, lo que lleva
a pensar en la importancia del contexto excitador.
PERSPECTIVAS TEÓRICAS DEL CONDICIONAMIENTO CLÁSICO
El propósito es integrar los conocimientos conductuales, cuantitativos y biológicos de los qué se

dispone hoy en día, lo que todavía no se ha conseguido.
PRIMEROS MODELOS TEÓRICOS CUANTITATIVOS DEL CONDICIONAMIENTO CLÁSICO:
1. Teoría de la Reducción del Impulso (Hull, 1943):
Hull afirmaba que las asociaciones entre un EC y la RC se formaban cuando la emisión de la

respuesta en presencia del estímulo iba seguida de una reducción del impulso.
Fórmula de Hull-Spence: rHi = 0 (M – Hi)
Donde:
− rHi = incremento en el hábito de aprendizaje (cambios en la asociación EC – RC)
− M = valor máximo del aprendizaje.
− Hi = fuerza del hábito al iniciarse el aprendizaje.
− 0 = parámetro de tasa de aprendizaje (que indica + o - velocidad de aprendizaje)
2. Teoría Estocástica del Aprendizaje o del Muestreo de Estímulo:
El refuerzo se define en términos de contigüidad entre el estímulo y la respuesta (no se tiene en

cuenta la reducción del impulso).
El EC sería el conjunto de elementos que, en cada ensayo, pueden asociarse con una respuesta
determinada o con su contraria. La teoría llega a un sistema de cuantificación del aprendizaje
muy parecido a la teoría de Hull.
Estos modelos sólo pueden explicar los supuestos de aprendizaje más sencillos, cuando un EC
se asocia a un EI, pero no pueden explicar otros fenómenos más complejos como el
eclipsamiento (ensombrecimiento u overshadowing) o el bloqueo.
- 28 -
MODELOS DE SELECCIÓN DE ESTÍMULOS:
Hacía falta modificar los modelos anteriores ya que se vio que la fuerza asociativa de un E dependía
también de la fuerza asociativa que habían adquirido también otros estímulos durante las sesiones
de entrenamiento.
1. Modelo de la Sorpresa del Estímulo (Kamin, 1969):
Lo que planteaba Kamin es que el aprendizaje dependía del grado de sorpresa que provocaba el
EI.
Su teoría permite explicar los fenómenos de bloqueo y de eclipse, aunque el siguiente modelo
recibe más apoyo empírico y es empleado en numerosas investigaciones actuales.
2. Modelo de Rescorla y Wagner:
La cantidad de aprendizaje lograda por el EC en un ensayo determinado depende de la fuerza

asociativa alcanzada por TODOS los estímulos presentes en ese ensayo.
Según el modelo, cuando NO se produce asociación entre los EC y los EI es porque se ha agotado
la capacidad del EI para provocar más condicionamiento.
Este modelo permite explicar el bloqueo de forma más acertada que el modelo de Kamin.
3. Modelo Atencional de Mackintosh (1975):
Según este autor, la reducción en la capacidad de producir fuerza asociativa se debe a que se
han producido cambios en la atención que se dedica al EC. Los EC son bloqueados o eclipsados
por una disminución de la atención que se les dedica.
El modelo de Rescorla y Wagner NO era capaz de explicar el fenómeno de inhibición latente,

pero este de Mackintosh sí.
También explica la irrelevancia aprendida, tanto en cuanto al condicionamiento excitador como

inhibitorio.
4. Modelo de Pearce y Hall (1980):
El modelo de Mackintosh NO ofrece tampoco respuesta satisfactoria a algunas situaciones de

aprendizaje.
Según Pearce y Hall, los organismos tienen una capacidad de procesamiento limitada respecto
a los EC y los EI que se presentan de forma simultánea. Los estímulos que vayan seguidos de una
consecuencia imprevista serán aquellos con más probabilidades de ser procesados.
El aspecto clave del modelo indica que un estímulo será procesado en la medida que NO sea un
buen predictor de sus consecuencias.
Este modelo es el que permite explicar el mayor número de fenómenos de aprendizaje.
- 29 -
5. Modelo de Tiempo Real de Schmajuck (1997):
Un aspecto clave de este modelo concreto es la traza del EC.
Una vez se ha presentado el EC, el sujeto haría una representación interna de él, que variaría en
el transcurso del tiempo x(t).
Para el modelo, el valor de la traza del EC sería máximo poco tiempo después de haber aparecido
el estímulo y decaería de forma negativamente acelerada cuando este dejara de presentarse.
OTROS MODELOS DEL CONDICIONAMIENTO CLÁSICO:
Otros modelos serían el de Sutton y Barto (1990), el modelo SOP de Wagner (1981) y los modelos de
Tiempo Real Complex (Coutureau y cols., 2002; Grossberg, 1975; Honey y Ward-Robinson, 2002;
Schmajuk y Dicarlo, 1992)
Todos ellos han procurado explicar nuevos fenómenos de aprendizaje, pero por ahora, no existe
ningún modelo que permita predecir de forma adecuada todos los fenómenos de aprendizaje
observados en el estudio del condicionamiento clásico.
Hoy en día siguen aflorando fenómenos de aprendizaje diferentes que no habían sido descritos con
anterioridad y será necesario, por tanto, un modelo teórico más amplio que pueda abarcarlos.
- 30 -
APLICACIONES DEL
INTRODUCCIÓN
"¿Es posible aplicar los principios de Cambio Conductual generados por Procesos de Aprendizaje
mediante Condicionamiento en condiciones artificiales y de laboratorio, a las situaciones complejas
y ecológicas de la vida cotidiana de los humanos?"
Se suele emplear técnicas basadas en el condicionamiento en diversos ámbitos y, a menudo, como

complemento de enfoques más amplios, inspirados en otros supuestos psicológicos.
Paulov creía que el aprendizaje y la educación resultaban en gran medida del establecimiento de
nuevas conexiones neuronales.
Es de suponer que el conocimiento de los principios que gobiernan el desarrollo de asociaciones debe
servir para promover técnicas psicológicas prácticas.
La elaboración formal de estrategias aplicadas basadas en el condicionamiento pauloviano tuvo lugar

a mediados de la década de los 50, al mismo tiempo que aquellas basadas en el condicionamiento
instrumental de Skinner.
TERAPIA DE CONDUCTA: Técnicas basadas en el Condicionamiento Clásico. Aplicadas principalmente

en el ámbito clínico: fobias, adicciones…
MODIFICACIÓN DE LA CONDUCTA: Técnicas basadas en el Condicionamiento Instrumental. Aplicables

a todos los ámbitos de intervención.
TERAPIA DE LA CONDUCTA
El caso del pequeño Albert (11 meses de edad) – Watson y Rayner (1920):
Le presentaron una rata blanca para que jugase. En un principio el niño NO mostraba ningún signo
de miedo. A continuación, cada vez que intentaba cogerla, los experimentadores generaban un
sonido fuerte que sorprendía y asustaba al niño. En pocos ensayos el pequeño Albert
experimentaba miedo cuando se le acercaba la rata.
Se produjo una generalización del miedo hacia otras mascotas y peluches de color blanco. Se trata
de uno de los primeros ejemplos de inducción experimental del miedo.
La 2ª fase, que contemplaba un contracondicionamiento hacia los objetos condicionados

anteriormente, NO se pudo llevar a cabo por la ausencia del niño.
- 31 -
El caso del pequeño Peter (1924), un niño de unos 3 años – Mary Cover Jones (19896 – 1987):
Se trata de un niño con miedo a los animales y objetos de peluche.
Contracondicionamiento: Exposición progresiva a los objetos que le daban miedo mientras tenían
lugar experiencias agradables para él como eran jugar o comer aquello que le gustaba.
Para potenciar los efectos añadió elementos de Aprendizaje Observacional o Modelado: la

presencia de otros niños que no solamente estaban tranquilos, sino que, además, se sentían
atraídos por los animales y los peluches.
El miedo fue remitiendo progresivamente.
Muchos miedos pueden haber sido adquiridos por Condicionamiento Clásico y mantenidos por
Condicionamiento Operante.
Evitación → Refuerzo negativo ………….. No EC sin EI ………….. No habituación.
Ej: Fobia a los aviones → Adquisición del miedo (CC) – Mantenimiento de la fobia (refuerzo
negativo, CO)
Seligman (1971) considera que, por razones evolutivas en el transcurso de la historia de la especie,
los humanos estamos innatamente más predispuestos a desarrollar fobias hacia unos objetos y
situaciones que hacia otros.
Ciertos individuos presentan mayor predisposición a sufrir fobias. Factores hereditarios y cognitivos
juegan un papel importante en el desarrollo de fobias:
1. Estilo de pensamiento caracterizado por la tendencia a malinterpretar como peligrosas

situaciones que NO lo son.
2. Focalizar exageradamente la atención en los peligros percibidos.
3. Recordar preferentemente y exacerbar las experiencias traumáticas.
El Condicionamiento Clásico puede ser especialmente útil para ayudar a conseguir alteraciones
emocionales.
Ha inspirado algunas técnicas como la Exposición y la Desensibilización Sistemática (ansiedad y

fobias).
DESENSIBILIZACIÓN SISTEMÁTICA:
Joseph Wolpe (1958), psiquiatra sudafricano, descontento con los planteamientos y los tratamientos
del psicoanálisis, desarrolla la Desensibilización Sistemática, que se parecía mucho al tratamiento
ideado por Mary Cover Jones.
- 32 -
Para eliminar los miedos se exponía a los pacientes de forma gradual a los objetivos y situaciones
fóbicas. De esta manera podían comprobar vivencialmente que no les pasaba nada en relación a
aquello que pudieran temer.
Posteriormente incluyó otro elemento: alguna actividad incompatible con el temor que lo pudiera
inhibir mientras duraba la exposición (normalmente era la inducción de un estado de relajación).
Acostumbraba a recurrir a las imágenes mentales al para evocar las escenas mudas.
La DESENSIBILIZACIÓN SISTEMÁTICA se definiría como un procedimiento terapéutico que, a partir del

Contracondicionamiento como antecedente, se base en el principio de Inhibición Recíproca y se
caracteriza por su naturaleza progresiva e imaginaria.
Consta de 3 pasos:
1. Entrenamiento en Relajación: De forma autocontrolada y siguiendo varios procedimientos.
2. Elaboración de la Jerarquía de Ansiedad: Los pacientes establecen una jerarquía rigurosa de
escenas que generan niveles progresivos de temor.
3. Afrontamiento progresivo y sostenido de cada paso de la jerarquía en estado de relajación: Los
pasos a afrontar deben ser asumibles. Si la cadena NO se puede seguir, se retrocede al punto
anterior de seguridad.
También se puede hacer uso de la desensibilización sistemática en vivo.
Algunos autores consideran que esta técnica NO es explicable por contracondicionamiento. Eysenck
(1976), por ejemplo, afirma que se trata de un simple fenómeno de extinción.
El EC (el temor) disminuiría porque se presenta sin el EI (la experiencia traumática original). Apoya
esta explicación el hecho de que la relajación NO resulta necesaria, es suficiente con la exposición
gradual. Aunque las fobias severas responden mejor al tratamiento si incluyen relajación.
Por otro lado, en la Desensibilización Sistemática es muy probable que intervengan tanto la extinción
como el contracondicionamiento.
A grandes rasgos podemos hablar de 2 tipos de técnicas:

1. Orientadas a extinguir (miedos y ansiedad, por ejemplo).
2. Orientadas a transformar en aversivos determinados estímulos y sustancias de consumo
abusivo, por ejemplo.
➢ TÉCNICAS DE EXPOSICIÓN:
La INUNDACIÓN es una exposición masiva y prolongada en condiciones de seguridad a la

situación fóbica sin que el paciente la pueda eludir con tal de NO dar lugar al Refuerzo Negativo
de la conducta de escapada o evitación.
La inundación resulta especialmente útil para los miedos condicionados. También para el
Trastorno por Estrés Postraumático (TEPT) y algunos Trastornos Obsesivos Compulsivos (TOC)
en los que intervienen elementos inductores de ansiedad.
Puede ser en vivo o en imaginación. También se hace uso de la realidad virtual.

- 33 -
➢ TERAPIA AVERSIVA:
Utilizada cuando algunos estímulos resultan excesiva e inadecuadamente atractivos (consumo

excesivo de alcohol, tabaco y otras drogas, comportamientos sexuales abusivos...)
Esta técnica tiene el propósito de reducir el atractivo de los estímulos. Deriva de la aversión
adquirida al sabor.
Inicios: administración de electrochoques en pacientes alcohólicos en la venta, oliendo y

probando el alcohol (Kantorovich, 1929) / “Tratamiento” homosexualidad (L.Max, 1935).
A partir de los años 50 se revisa la técnica y se le da los usos actuales (Joseph Wolpe).
Esta técnica asocia la visión, olor y sabor (de las bebidas alcohólicas, por ejemplo) con alguna
sustancia emética (que provoca el vómito) como la emetina o el litio.
Se aplica al tabaquismo, a la adicción a otras drogas y también para tratar delincuentes sexuales.
Cuando se emplean Estímulos aversivos imaginarios hablamos de Sensibilización Encubierta.

Imágenes repulsivas para combatir comportamientos peligrosos (Ej: en la conducción o en el
consumo de drogas).
Algunas de estas técnicas compaginan los planteamientos del Condicionamiento Clásico y

también los del Condicionamiento Operante.
OTRAS APLICACIONES:
➢ APLICACIONES MÉDICAS:
Las claves contextuales (en las drogodependencias) pueden desencadenar el síndrome de

abstinencia en la persona intoxicada.
El procedimiento de exposición a estas claves es efectivo, no solo como complemento de otros

tratamientos más convencionales. Esta exposición resulta aún más eficaz si se da en varios
contextos, incluyendo el contexto de adquisición. Así se puede favorecer la supresión total de
las reacciones condicionadas compensatorias frente a las claves de la droga.
Es posible acabar condicionando la respuesta del sistema inmunitario, endocrino y nervioso ante
determinadas drogas, fármacos o estímulos.
Efecto placebo.
Técnicas de potenciación inmunológica condicionada → Pocas evidencias en humanos.
➢ PUBLICIDAD:
Las actitudes, las preferencias, el valor afectivo de las cosas e, incluso, los estados motivacionales
son susceptibles de ser condicionados.
- 34 -
Emparejamiento del producto con personas, términos, imágenes, músicas y escenas altamente
positivas: prestigio, éxito, riqueza, calidad, diversión, belleza, atractivo sexual…
La idea es transferir a los productos unos sentimientos y emociones favorables, potenciar su

imagen y aumentar la probabilidad de ser elegidos y consumidos.
Experimento de Smith y Engel (1968): Coche con chica y sin.

Participantes: 120 hombres.
Resultados: Coche con chica percibido como más atractivo, mejor diseñado, más caro, rápido
y menos seguro.
Experimento de Stuart, Shimp y Eagle (1987):

Con pasta dental y escenas positivas (paisajes naturales) → Pasta – Escenas //
Condicionamiento demorado el más efectivo.
Experimento de Gibson (2008) sobre condicionamiento evaluativo (transferencia de valencia

entre estímulos) de la actitud respecto a las marcas → Emparejamiento de palabras e imágenes
positivas, aunque los participantes no tuvieran una preferencia previa.
- 35 -
TEMA 3: CONDICIONAMIENTO
INSTRUMENTAL U OPERATIVO
CONDICIONAMIENTO OPERANTE
La adaptación al entorno requiere la predicción y anticipación de los acontecimientos, pero también

conocer las consecuencias positivas y negativas de cada comportamiento.
En el aprendizaje instrumental, una conducta se desarrolla según las consecuencias que produce.
El proceso de aprendizaje a través del cual algunas conductas se mantienen y otros desaparecen en
función del efecto que producen sobre el propio individuo, se denomina condicionamiento
instrumental u operativo.
EL CONDICIONAMIENTO OPERATIVO O INSTRUMENTAL se refiere al comportamiento voluntario.
Una conducta instrumental es aquella que nos sirve para lograr determinadas consecuencias.
Muchos hechos dependen de nuestra conducta.
El condicionamiento instrumental u operativo es un tipo de aprendizaje asociativo en el que el

comportamiento se consolida si hay un refuerzo positivo y se mitiga si no hay consecuencias o si hay
un castigo.
Mientras que en el condicionamiento clásico el esquema temporal es estímulo – respuesta (E-R), en

el nuevo modelo es al revés.
Primero se espera del animal un comportamiento o conducta determinada y, cuando se produce, se

presenta el estímulo, también llamado refuerzo (R-Eref).
Esta nueva visión de Thorndike fue elaborada y ampliada por Skinner.
DE THORNDIKE A SKINNER: PRIMEROS ESTUDIOS EN CONDICIONAMIENTO

OPERANTE
THORNDIKE:
El primer investigador del condicionamiento instrumental fue Edward L. THORNDIKE (1874-1949).
En 1898 Edward Thorndike realizó varios experimentos con gatos que mostraban que, si una
conducta era seguida por una consecuencia positiva para el organismo que la realizaba, la
probabilidad de que el organismo volviese a ejecutar este comportamiento aumentaba.
- 36 -
Estaba interesado en entender cómo los gatos resolvían los problemas.
Observó su comportamiento en situaciones en las que tuvieron que hacer alguna acción para lograr
un objetivo (escapar de una jaula, conseguir comida, etc.).
Los colocó en una caja problema y midió cuánto tiempo tardaban los gatos en escapar y acceder al
tazón con comida. Observó que el tiempo disminuía. Dijo que los gatos resolvieron el problema
probando errores.
Para Thorndike, la explicación del aprendizaje estaba en las conexiones que se establecen entre los
estímulos y las respuestas a partir del ensayo y error.
De esta manera, los organismos adquieren progresivamente aquellas conductas que producen
consecuencias positivas, a la vez que se suprimen aquellos comportamientos que conducen a
consecuencias desagradables. En otras palabras, la recompensa aumenta las respuestas, mientras
que el castigo las elimina. De ahí su Ley de efecto:
"Cualquier conducta que en una situación produzca un resultado satisfactorio, será más probable en
el futuro".
LEY DEL EFECTO

La LEY DEL EFECTO: El aprendizaje está controlado por sus
consecuencias. Aquellos comportamientos seguidos por buenas Respuestas Respuestas
consecuencias se repiten, los que van seguidos de malas SEGUIDAS de SEGUIDAS de
consecuencias o de no consecuencias no se repiten. consecuencias consecuencias
REFORZANTES AVERSIVAS
El estímulo presente en el momento de la respuesta y la propia
respuesta quedan conectados de forma que en el futuro la Mayor Menor
presencia de los estímulos activaría directamente la respuesta a probabilidad de probabilidad de
ellos conectada. Si la consecuencia es aversiva, la conexión se ocurrencia ocurrencia
debilita. cuando el E cuando el E
vuelva a aparecer vuelva a aparecer
Ea (estímulo inicial) → C (conducta) → Con (consecuencia/refuerzo) [negrita parte de énfasis para

Thorndike]
Si la consecuencia es positiva, se está reforzando la conducta y cada vez la realizará más rápido ante
el estímulo → Aprendizaje
Cuantas más veces repitamos esta conducta más rápido la aprenderemos. Sin embargo, si dejamos
de realizar la conducta, cada vez será mayor el olvido.
- 37 -
Paralelamente, Thorndike pensaba que la repetición de una respuesta fortalece la conexión entre el
estímulo y la respuesta, mientras que la falta de práctica debilita esta conexión (E-R). A este principio
lo llamó la LEY DEL EJERCICIO.
Si bien las ideas de Thorndike son recordadas más como antecedentes de las teorías modernas que
por su valor actual, la influencia de ideas como el poder de recompensa en el aprendizaje han sido
clave en el desarrollo posterior de las teorías del aprendizaje, lo que convierte a este investigador en
una figura muy relevante.
SKINNER:
Más tarde, Burrhus Frederic Skinner desarrolló el concepto de condicionamiento operativo o

instrumental a partir de las ideas de Thorndike.
Skinner planteó dos problemas en la investigación sobre la conducta basada en consecuencias:
− Si utilizamos cajas problemáticas o laberintos, el comportamiento que observamos es

discreto (limitado).
− ¿Cómo dividir el comportamiento en trozos analíticos, cuando en el mundo real vemos que
es un continuo?
Ea (estímulo inicial) → C (conducta) → Con (consecuencia/refuerzo) [negrita parte de énfasis para

Skinner]
Para resolver estos problemas:
− Diseñó un dispositivo (la caja de Skinner) que permitiría al organismo emitir la conducta sin
restricciones para poder medir conductas similares a las que tienen lugar en el mundo real.
− Planteó la idea de operante: una unidad de comportamiento que se define por los efectos
que operan en el medio ambiente (da lugar al nombre de condicionamiento operante).
La Caja de Skinner o caja de condicionamiento es una cabina con diversos elementos que sirven para
ejecutar respuestas y presentar estímulos (palancas y llaves de respuesta, dispensadores de
alimentos, rejilla metálica para descargas eléctricas, altavoces, luces, etc.)
Cuando el animal (ratón) premia casualmente la palanca (respuesta) recibe comida (estímulo -
refuerzo).
Si en los ensayos discretos la conducta del animal estaba restringida por las condiciones programadas
por el investigador, en la preparación del operante libre es el animal el que determina cuándo y con
qué frecuencia realizará su conducta a lo largo del tiempo.
Skinner propuso la Tasa de Respuesta como una medida para analizar el comportamiento operativo.
La forma más común de medir la tasa de respuesta es a través del registro acumulativo de respuestas
(forma de representar la repetición de una respuesta a lo largo del tiempo).
- 38 -
Skinner no habla de la asociación estímulo-respuesta, sino del incremento de la fuerza de la respuesta
debido a las consecuencias que le siguen.
Las respuestas a una situación que van seguidas de refuerzo se fortalecen y es más probable que se
repitan en el futuro.
DIFERENCIAS ENTRE CI (COND. INSTRUMENTAL) Y CC (COND. CLÁSICO)
Ambos se basan en el mecanismo de ASOCIACIÓN y sus principios.
− En el Condicionamiento Clásico se asocian dos estímulos que el organismo NO puede

manipular.
− En el Condicionamiento Instrumental se asocia una conducta y un estímulo (consecuencia).
La Conducta alterará el Estímulo.
Ej: Se pone a llover, abrimos el paraguas (Conducta) y NO nos mojamos (No Estímulo)
Se pone a llover, NO abrimos el paraguas (NO Conducta) y nos mojamos (Estímulo).
APRENDIENDO A ASOCIAR:
CONDICIONAMIENTO CLÁSICO  Estímulo Neutro (EN) EI que genera una RI
El organismo aprende asociaciones de estímulos que están fuera de su control.
CONDICIONAMIENTO OPERANTE  Conducta Consecuencia
El organismo aprende asociaciones entre su comportamiento y las consecuencias de este

comportamiento.
El condicionamiento clásico y operante siguen procesos diferentes, aunque nada impide que se den
juntos para lograr el establecimiento de conductos.
De hecho, no es raro que aparezcan juntos en la vida diaria ni en los procedimientos experimentales.
CONDICIONAMIENTO
OPERANTE
Una respuesta (R) va seguida
Se emparejan dos estímulos
SUCEDE CUANDO… por un estímulo reforzante
(EI y EC)
(Eref)
NATURALEZA DE LA Involuntaria: elicitada por el Voluntaria: emitida por el
RESPUESTA estímulo organismo
ASOCIACIÓN QUE REQUIERE EC – RC R – Eref
- 39 -
PROCEDIMIENTOS DEL CI
Podemos distinguir cuatro tipos de consecuentes, en función de dos parámetros:
− El primer parámetro es si lo consecuente hace que la conducta aumenta o, por el contrario, hace
que disminuya. Este parámetro está relacionado con el carácter apetitivo (agradable) o aversivo
(desagradable) de la consecuencia o la situación consecuente que se genera.
− El segundo parámetro está relacionado con la forma en que se presenta (o desaparece) el
consecuente: puede aparecer después del comportamiento, o puede desaparecer como
consecuencia de este, o el comportamiento puede prevenir su aparición.
Así que:
− A un hecho agradable lo llamaremos Estímulo Apetecible
− A un hecho desagradable lo llamaremos Estímulo Aversivo
Los diferentes procedimientos de Condicionamiento Instrumental se clasifican según la Contingencia

o entre la respuesta y el estímulo sobre el que actúa la respuesta, y por la naturaleza del Estímulo
Consecuente.
Un REFUERZO es cualquier estímulo que aumenta la probabilidad de una conducta. Hay 2 tipos:
− Refuerzo PRIMARIO: estímulos biológicamente importantes.

− Refuerzo SECUNDARIO: estímulos que tienen propiedades reforzantes debido a su asociación
con refuerzos primarios.
1. REFUERZO POSITIVO:
Una respuesta (conducta) provoca la aparición de un Estímulo Apetitivo.
Si hay R (respuesta), entonces hay E+ (estímulo apetitivo)

Si NO hay R, entonces NO hay E+
La Contingencia entre R y E+ es positiva.
El REFUERZO POSITIVO tiene como efecto el incremento de la probabilidad de la aparición de

una conducta determinada.
2. CASTIGO POSITIVO o simplemente CASTIGO:
Una respuesta (conducta) provoca la aparición de un Estímulo Aversivo.
Si hay R (respuesta), entonces hay E- (estímulo aversivo) → Ej: Si ponemos el dedo en el enchufe
Si NO hay R, entonces NO hay E- nos electrocutamos.
La Contingencia entre R y E- es positiva.
El procedimiento de CASTIGO reduce la probabilidad de aparición de una conducta determinada.
- 40 -
3. REFUERZO NEGATIVO:
Una respuesta (conducta) provoca la NO aparición de un Estímulo Aversivo.
La Contingencia entre R y E- es negativa.
Dentro del refuerzo negativo hablamos de dos procedimientos:
▪ De ESCAPADA: Si hay E- (E. aversivo) inicial, seguidamente R, entonces ya NO hay E-.

Ej: Encontramos un perro (E- inicial) y huimos (R), entonces ya no tenemos miedo al
perro (No E-)
▪ De EVITACIÓN: Si NO hay E- inicial, seguidamente R, entonces NO hay E-.
Ej: No hay avería en el coche (No E-) y hacemos la revisión (R), entonces no tenemos
avería (No R-)
El REFUERZO NEGATIVO eleva la probabilidad de la conducta en un futuro.
4. CASTIGO NEGATIVO o Entrenamiento de Omisión:
Una respuesta (conducta) provoca la NO aparición de un Estímulo Apetitivo.
Si hay R (respuesta), entonces NO hay E+ (estímulo apetitivo)

Si NO hay R, entonces hay E+
La Contingencia entre R y E+ es negativa.
Este procedimiento también se llama Refuerzo Diferencial de otras conductas.
El CASTIGO NEGATIVO reduce la probabilidad de aparición de una conducta determinada.
▪ El REFUERZO hace que la aparición de la conducta (o R) aumente.

▪ El CASTIGO hace que la aparición de la conducta (o R) disminuya.
EFECTO
La conducta se La conducta se
incrementa elimina
REFUERZO POSITIVO
Se administra CASTIGO POSITIVO
(buenas
(aparece) (colleja)
calificaciones)
ESTÍMULO
REFUERZO NEGATIVO CASTIGO NEGATIVO
Se suprime
(exento de hacer (no ver TV durante la
(desaparece)
tareas de casa) semana)
- 41 -
Contingencia de respuesta y
Resultado
resultado
POSITIVO: La respuesta genera Reforzamiento o aumento en
REFUERZO POSITIVO
un estímulo apetitivo la tasa de respuesta
POSITIVO: La respuesta genera Castigo o disminución en la
CASTIGO POSITIVO
un estímulo aversivo tasa de respuesta
NEGATIVO: La respuesta elimina
REFUERZO NEGATIVO Reforzamiento o aumento en
o previene la ocurrencia del
(escape /evitación) la tasa de respuesta
estímulo aversivo
NEGATIVO: La respuesta elimina
ENTRENAMIENTO POR Castigo o disminución en la
o previene la ocurrencia de un
OMISIÓN (RDO) tasa de respuesta
estímulo apetitivo
ELEMENTOS DEL CI
Los elementos considerados por el Condicionamiento Operativo son tres:
1. Estímulos o antecedentes discriminatorios

2. Respuestas
3. Fortalecimiento del estímulo y las consecuencias
1. EL ESTÍMULO DISCRIMINATIVO O ANTECEDENTE:
Es el que aparece antes de que se ejecute la conducta instrumental y, por lo tanto, es el

antecedente de la conducta instrumental.
Thorndike creía que era este Estímulo Discriminatorio el que controlaba la conducta
instrumental, SKINNER demostró que no, que era el Estímulo de Refuerzo.
Consecuencias → Ej: El comportamiento de presionar la palanca (con ratas) aumenta si hay un

refuerzo y disminuye si no está allí.
El Estímulo Discriminatorio parece actuar como INFORMANTE de la disponibilidad o no del

refuerzo. La diferencia entre un E Discriminatorio y una E Condicional no siempre es clara.
2. RESPUESTA INSTRUMENTAL O CONDUCTA INSTRUMENTAL:
Hay comportamientos más sencillos de condicionar que otros.
Algunos límites en este sentido están relacionados con la preparación biológica de los
organismos para enfrentar ciertas situaciones, otros tienen que ver con la interferencia de
conductas innatas con las que se quiere condicionar.
- 42 -
THORNDIKE → Concepto de PERTENENCIA: "Ciertas conductas son coherentes con el reforzador
por la historia evolutiva de la especie". Manipular objetos o apoyarse en la pared son
comportamientos naturales de un gato al escapar de una jaula, bostezar o rascarse no.
Breland y Breland (1961) encontraron dificultades para condicionar ciertos comportamientos

con cerdos u osos limpiadores.
Algunas conductas impedían la presentación del reforzador con gran fuerza, tenían que ver con
el poder instintivo del mismo o, como lo llamaban los autores, la deriva instintiva.
(Los sujetos se alejan de los comportamientos reforzados hacia los comportamientos instintivos
que aparecen cuando se busca el refuerzo).
3. EL ESTÍMULO REFORZADOR:
Algunos estímulos reforzadores son biológicamente poderosos, como los alimentos.
3 aspectos a tener en cuenta:

− Existe una gran variedad de estímulos que actúan como reforzadores.
− Algunos reforzadores pueden ser inicialmente estímulos neutros y luego pueden
convertirse en estímulos reforzadores.
− Complejidad en humanos (ej: búsqueda de atención, reducción de la ansiedad, cariño…).
▪ ESTÍMULO REFORZADOR cualquier consecuencia que, presentada de manera contingente

a una conducta, aumente la posibilidad de que la conducta se repita en el futuro.
▪ ESTÍMULO PUNITIVO cualquier consecuencia que, presentada de manera contingente a una
conducta, reduzca la probabilidad de aparición de esta conducta en el futuro.
Sabemos si un Estímulo es Reforzador o Punitivo en función de sus consecuencias en la

conducta. Ej: Un caramelo puede ser un refuerzo para un niño, pero no serlo para otro.
En este punto llegamos a una definición circular: la comida es un reforzador porque aumenta la
conducta contingente y la conducta contingente aumenta porque la comida es un reforzador.
Para desarrolla la cuestión se han propuesto definiciones alternativas basadas en el concepto de

PRIVACIÓN:
→ Definición de HULL: Un estímulo es reforzador en función de si y cuánto disminuye el

estado de necesidad.
→ Definición de PREMACK: Parte del análisis de la actividad libre, aquella que el sujeto
despliega cuando no tiene ningún tipo de restricción. Introduce el concepto de
preferencia de actividad. Y añade que una actividad preferida reforzará una actividad
menos preferida si la 1ª es contingente de la 2ª.
- 43 -
Se pueden hacer contingentes dos conductas.
Se restringe la conducta preferida (1) y se establece que solamente se tendrá acceso a ella si
previamente se ha dedicado cierto tiempo a la conducta menos preferida (2).
Como consecuencia cualquier conducta puede actuar como reforzador de la segunda si se dan
las condiciones indicadas.
ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL:
Determinados estímulos que NO son biológicamente potentes también tienen la capacidad de

reforzar los comportamientos con los que son contingentes.
Ej: El dinero → No es un estímulo primario biológicamente hablando. Lo hemos ido asociando con
todos los bienes que podemos llegar a obtener con él.
En el condicionamiento instrumental:
− El EI hace de reforzador (primario).
− El EC es el Estímulo Neutro que hará de reforzador condicionado o secundario (después de
emparejarlo con el reforzador primario).
El concepto de REFORZADOR GENERALIZADO de Skinner es parecido al de reforzador condicionado:

un tipo de reforzador condicionado que se ha asociado a muchos reforzadores primarios. (Ej: Dinero)
El poder del reforzador generalizado depende de que continue asociado a los reforzadores primarios.
VARIABLES INFLUYENTES EN EL CI
A) CANTIDAD Y NATURALEZA DEL REFORZADOR:
Algunas variables como la cantidad y la naturaleza del reforzador determinan la Tasa de

Respuesta Instrumental.
HUTT (1954): Cuanta más cantidad y calidad del reforzador (de la comida en sus experimentos
con ratas), mayor es la Tasa de Respuesta Instrumental.
▪ CONTRASTE POSITIVO: Cambios en la conducta que se dan cuando se aumenta la cantidad

de reforzador.
▪ CONTRASTE NEGATIVO: Cambios en la conducta debidos a una reducción en la cantidad
habitual de reforzador.
Los efectos de CONTRASTE (tanto + como - ) dependen de la cantidad y calidad del refuerzo
recibido en el pasado.
FLAHERTY (1996): Los mecanismos que actúan sobre el CONTRASTE + y el CONTRASTE – serían
diferentes.
- 44 -
B) CONTIGUIDAD TEMPORAL Y CONTINGENCIA:
Los procesos de aprendizaje nos permiten extraer qué regularidades se dan en nuestro entorno.
Algunos estímulos dependen de nuestro comportamiento (en mayor o menor medida) y otros
no.
Se han tenido en cuenta dos tipos de principios para explicar cómo se asocian 2 eventos:
1. El principio de CONTIGÜIDAD TEMPORAL
2. El principio de CONTINGENCIA
1. El principio de CONTIGÜIDAD TEMPORAL:
En el Condicionamiento Clásico se determina que la Contigüidad Temporal es un factor clave

para que ocurra la asociación.
Si se incrementa la DEMORA, el aprendizaje es más débil.
Sin embargo, también aprendemos las relaciones entre la conducta y el reforzador, aunque
la recompensa NO se proporciona inmediatamente.
Los resultados indican que cuando se señala un Reforzador Retardado, se incrementaban los
juicios de la relación causal entre respuesta y reforzador respecto a cuando el reforzador NO
estaba señalado. La señal que ilumina el botón del ascensor una vez lo hemos pulsado actúa
como reforzador secundario o acondicionado.
2. El principio de CONTINGENCIA:
Existen suficientes ejemplos que nos indican que la Contigüidad Temporal NO es suficiente
ni necesaria para el establecimiento de relaciones. De lo contrario, tendríamos la cabeza llena
de asociaciones irrelevantes.
En el Condicionamiento Clásico ya se hablaba de Contingencia, es decir, de la probabilidad

de que EI se presentara con el EC o en su ausencia.
En el Condicionamiento Instrumental la Contingencia es más importante que la Contigüidad

temporal.
PROGRAMAS SIMPLES DE REFUERZO
Un programa de refuerzo es el conjunto de criterios que determina si una conducta irá seguida por
un refuerzo o no.
Se establecen en base al NÚMERO DE RESPUESTAS que hace falta dar y al TIEMPO que debe pasar
desde que se ha presentado un reforzador y que el siguiente está disponible.
Los programas de refuerzo pueden influir en la adquisición de nuevas conductas.
- 45 -
Se han estudiado sus efectos sobre:
1. Mantenimiento de conductos ya adquiridos.
2. Extinción de conductas que se quieren eliminar.
En situaciones de Operante Libre los diferentes programas simples de refuerzo provocan patrones
de respuesta bien definidos y diferenciados.
TIPOS:
PROGRAMAS DE REFORZAMIENTO
➢ REFUERZO CONTINUO:
Un prgrama de Reforzamiento Continuo es aquel en el que cada vez que aparece una Respuesta
Operante va seguida de un Reforzador.
Ej: En un trabajo el sueldo (reforzador) se da únicamente una vez al mes, a final de mes (IF 1
mes). No importa si trabajs mucho durante este mes, ni cuántas veces vayas al médico, solo
recibirás un nuevo sueldo un mes después del anterior.
➢ REFUERZO PARCIAL O INTERMITENTE:
Los programas en los que la respuesta NO siempre va seuida del reforzador se llaman programas
de Reforzamiento Parcial o Intermitente.
Ej: Puedo llevar al cine a mis hijos una vez cada 4 semanas como media (IV 4 semanas). Si no se
portan bien no les llevo, pero si se portan bien los llevaré solo si hace tiempo que no vamos,
como media, si hace 4 semanas que no vamos. Por muy bien que se porten, no los llevo hoy y
mañana otra vez.
- 46 -
PROGRAMAS DE RAZÓN:
El reforzamiento intermitnte da lugar a los programas de razón.
Un Programa de Razón pone como condición que la respuesta se de un determinado número de

veces antes de proporcionar un refuerzo.
▪ RAZÓN FIJA (RFn): El número de respuestas es CONSTANTE.

▪ RAZÓN VARIABLE (RVn): El número de respuestas es VARIABLE.
Ej: RV5 nos indica que 5 es la media de respuestas que hace falta dar para recibir refuerzo.
Este programa es más lento, más persistente y con una mayor resistencia a la extinción.
PROGRAMA INTERMITENTE DE RAZÓN FIJA:
Los Programas INTERMITENTES de RAZÓN FIJA (RFn) generan un patrón de respuesta característico.
Si la razón es bastante grande se observa que NO hay respuesta durante un tiempo después de
recibir el reforzador. Este fénomeno se llama PAUSA POSTREFORZAMIENTO. Pasada esta pausa los
sujetos inician la respuesta con una tasa alta y estable hasta lograr el nuevo reforzador. Este
fenómeno se llama CARRERA DE LA RAZÓN.
El entrenamiento comienza con Programas de Razón baja y se va incrementando la razón hasta

llegar a la que se quiere.
Los incrementos en la razón NO pueden ser excesivamente grandes porque sino se deja de
responder.
Cada vez que se incrementa la razón de forma repentina y significativa aparece lo que llamamos
TENSIÓN DE LA RAZÓN: pausas periódicas durante la carrera de la razón. Si la tensión es extrema,
el sujeto puede dejar de responder.
Se considera que estas pausas tienen que ver con la evaluación que hace el sujeto del esfuerzo que
le hará falta para lograr el siguiente reforzador.
PROGRAMA INTERMITENTE DE RAZÓN VARIABLE:
En cuanto a los Programas INTERMITENTES de RAZÓN VARIABLE (RVn), en los

cuales el número de respuestas requeridas para recibir el reforzador va
variando, las pausas postreforzamiento desaparecen.
La Tasa de Respuesta en los Programas de Razón Variable (RVn) es más estable que en los de Razón
Fija (RFn).
- 47 -
PROGRAMAS DE INTÉRVALO:
En los Programas de Intérvalo, a demás de dar cierto número de respuestas para obtener el
reforzador, se añade una segunda condición: tiene que haber transcurrido cierto tiempo entre la
presentación del anterior reforzador y el momento en el que el siguiente está disponible.
PROGRAMA INTERMITENTE DE INTÉRVALO FIJO:
El periodo de tiempo es FIJO (Ej: IF1 semana → para ver una serie).
En un programa de Reforzamiento de Intérvalo Fijo 2 minutos (IF2’), desde el momento en el que

se ha entregado el reforzador pasaran 2 minutos antes de que vuelva a estar disponible. Pasados 2
minutos, si se ejecuta la respuesta operante, se volverá a ofrecer el reforzador.
Los programas de Intérvalo Fijo también generan un patrón de respuesta particular.
Igual que en el RF, los sujetos dejan de responder después de recibir el reforzador. Ahora bien, a
diferencia de los RF en los que seguidamente la Tasa de Respuesta era estable y alta, en los
programas IF la tasa aumenta exponencialmente (al final del intérvalo la tasa se dispara).
Parece que los sujetos experimentales disponen de algún mec anismo de medida del tiempo.
A medida que va pasando el tiempo la probabilidad de recibir el reforzador es más elevada y, por
tanto, se va incrementando la Tasa de Respuesta.
PROGRAMA INTERMITENTE DE INTÉRVALO VARIABLE:
También existen los Prgramas INTERMITENTES de INTÉRVALO VARIABLE o IV en los cuales el tiempo
es imprevisible. Por ejemplo, en un programa IV2’ el reforzador está disponible a partir de 2’ de
media de tiempo desde que se ha presentado el último reforzador. En este tipo de programas la
Tasa de Respuesta es más estable y desaparece el patrón de gráfico exponencial.
Nos puede importar también una restricción del tiempo durante la cual estará disponible el
reforzador. Por ejemplo, el reforzador puede estar disponible pasados 2’ pero dejar de estarlo
pasado 20’’ más. → Esta situaciçon experimental se llama ESPERA LIMITADA y se puede aplicar
tanto a IF como a IV.
- 48 -
GRÁFICAS TÍPICAS DE LOS REGISTROS ACUMULATIVOS DE LOS 4 PROGRAMAS DE REFUERZO
SIMPLES:
COMPARATIVA DE LOS PROGRAMAS DE RAZÓN Y DE INTÉRVALO:
− En los programas fijos (RF y IF) se observa una pausa de respuesta después de recibir el
reforzador. En los variables esta pausa NO está.
− Los programas de Razón (R) generan más Tasa de Respuesta que los de Intérvalo (I).
Esto puede ser debido al hecho de que en los primeros la obtención del reforzador depende de
las respuestas del sujeto, mientras que en el segundo caso, además, interviene el tiempo. Los
primeros generan más motivación que los segundos.
Una explicación alternativa estaría relacionada con los procesos de reforzamiento. En los
programas de Razón (R) se refuerzan los tiempos cortos entre respuestas. En el caso de los
programas de Intérvalo (I) se refuerza que se espere un tiempo entre respuesta y respuesta y,
por tanto, un periodo de tiempo largo y dilatado.
PROGRAMA DESCRIPCIÓN EFECTOS EJEMPLOS

Tasa de respuestas muy Una costurera que
Refuerzo después de un
Razón Fija alya y una breve pausa recibe dinero por cada
número fijo de respuestas.
después de cada refuerzo. 10 camisas.
Refuerzo depués de un Tasa de respuestas muy
Razón
número variable de alta y resistencia a la Maquinas tragaperras.
Variable
respuestas. extincion.
Se refuerza la conducta Tasa baja de respuestas
Conducta de estudio
Intérvalo Fijo después de un tiempo después del refuerzo y
ante un examen.
determinado. alta justo antes.
Se refuerza la primera Profesor que pone una
Intérvalo Tasa no muy intensa de
respuesta que se da después prueba cada semana
Variable respuestas, pero estable.
de un tiempo variable. sin fijar la fecha.
- 49 -
EJERCICIOS CONDICIONAMIENTO INSTUMENTAL U OPERANTE
1. Pon 3 ejemplos de cada tipo de procedimiento en el CI:
REFORZAMIENTO POSITIVO:
− Darle una chuche a un niño cada vez que hace bien todos los deberes.
− Dejarle ver media hora de tele si cena todo sin quejarse.
− Hacer un regalo por sacar muy buenas notas en el trimestre.
CASTIGO POSITIVO:
− Mandar copiar 100 veces.
− Aumentar el nº de flexiones a hacer en un entrenamiento.
− Prolongar la realización de la tarde durante una semana más.
REFORZAMIENTO NEGATIVO:
− Exento de hacer los deberes “extras”
− Exento de madrugar el fin de semana.
− Exento de llevar a cabo cierta obligación.
CASTIGO NEGATIVO:
− No jugar a la play hasta que no recupere la asignatura.
− No salir con los amigos el fin de semana.
− No ir a la fiesta que quería.
2. Explica los siguientes casos de condicionamiento instrumental u operante usando todos los
conceptos técnicos necesarios:
− Cada vez que María estudia durante 2 horas seguidas, sus padres le sueltan al parque para
jugar con sus amigos. Al cabo de un tiempo, Maria estudia durante dos horas seguidas cada
tarde → Refuerzo positivo
− Cuando Xavier no hace la cama por las mañanas, sus padres no le dejan bajar al parque para
jugar con sus amigos. Al cabo de un tiempo siempre hace la cama por la mañana → Castigo
negativo (porque disminuye la conducta de no hacer la cama porque sino le dejan sin
parque)
- 50 -
− Cuando el perro de Raquel deja de ladrar, le quitan el bozal. Después de un tiempo el perro
de Raquel casi nunca labra. → Refuerzo negativo de evitación (porque la conducta de no
ladrar aumenta y desaparece el bozal, no ladra para evitarlo)
3. Intenta explicar técnicamente los siguientes procesos de aprendizaje relacionados con el

condicionamiento instrumental u operante. Utiliza los conceptos de extinción, refuerzo positivo,
refuerzo negativo, castigo positivo y castigo negativo.
− Cada vez que Felipe comienza a contar chistes, su mejor amigo de lo que quiere su
compañía, se retira. Felipe explica chistes con menos frecuencia. → Castigo negativo
− Luisa prestaba atención a su hijo siempre que golpeaba la pared con el puño (refuerzo
positivo). Pasados unos meses, su hijo golpea la pared cada vez con más frecuencia. Sin
embargo, desde que Luisa decidió ignorar cuándo lo hacía, su hijo ha dejado de golpear la
pared. → Castigo negativo
− Siempre que Patricia habla de alguna cosa seria, Pau se rie y se burla de ella. Ahora, Patricia
pocas veces intenta introducir temas serios en su conversación con su amigo. → Castigo
positivo
− Cuando Adrián habla con su compañero Ricardo en clase, la profesora les pone un punto
negativo. Al acabar el primer trimestre, Adrián hablaba mucho menos con Ricardo en clase
→ Castigo positivo (porque disminuye la conducta de hablar y aparece el castigo)
− Cuando Laura reconoce sus travesuras ante su tutor, éste le riñe y la castiga. Así que Laura
ha dejado de confesar sus acciones incorrectas → Castigo positivo
− Se encierra a un perro en una habitación en la que suena un sonido que le espanta. No
obstante, cada vez que el perro se acerca a un lado el sonido se corta. Con el tiempo, el
perro se aproxima a este lado cada vez que le cierran → Refuerzo negativo (porque
aumenta la conducta y desaparece el estímulo negativo)
7. ¿Qué tipo de programa de refuerzo siguen los siguientes ejemplos?:

− Un vendedor recibe una gratificación después de hacer diez ventas → Programa de Razón
Fijo (10) → cada cierto nº de respuestas.
− Un estudiante recibe un regalo todos los años, siempre que apruebe todo → Programa de
Intérvalo Fijo (1 año) → cada cierto tiempo que es fijo.
− Cada examen aprobado es premiado con una pequeña propina → Programa de Razón Fija
(1) = Refuerzo continuado → todas las respuestas.
− Una máquina tragaperras reparte los premios aleatoriamente, pero manteniendo un
porcentaje promedio de monedas introducidas y premios entregados → Programa de
Razón Variable (x) → cada cierto nº de respuestas pero no es fijo, sino que está en torno a
un promedio.
− Los accionistas de una empresa cobran dividendos una, dos o tres veces al año → Programa
de Intérvalo Variable → cada cierto tiempo, pero no es fijo, isno que está en torno a un
promedio.
- 51 -
PROGRAMA CONCURRENTE Y PROGRAMA CONCURRENTE
ENCADENADO SIMPLE DE REFUERZO
PROGRAMA CONCURRENTE:
La CONDUCTA DE ELECCIÓN se estudia normalmente en laberintos.
Actualmente existe un procedimiento para estudiar la conducta continua. → En un experimento

estándar se coloca al sujeto experimental sometido simultáneamente a 2 Progremas de Refuerzo,
por ejemplo IV30’’ y RV22.
Se mide la Respuesta de Elección con las siguientes fórmulas:
1. Ra / (Ra + Rb) Ra = respuestas en relación al programa de refuerzo a

2. Rb / (Ra + Rb) Rb = respuestas en relación al programa de refuerzo b
También se puede calcular otro parámetro que permite ver si la distribución de respuestas está
influenciada por el refuerzo obtenido en cada alternativa. Este parámetro es la TASA RELATIVA DE
REFORZAMIENTO.
Las fórmulas:
1. ra / (ra + rb) ra = tasa de reforzamiento en relación al programa a

2. rb / (ra + rb) rb = tasa de reforzamiento en relación al programa b
La conclusión que se extrae es que los sujetos experimentales ajustan la Tasa Relativa de Respuestas
a cada uno de los programas de forma que se acerquen mucho a la Tasa Relativa de Reforzadores
obtenidos para aquella alternativa.
Se cumpliría la llamada LEY DE LA GUALACIÓN: Ra / (Ra + Rb) = ra / (ra + rb)
Esta ley se ha mostrado válida para otros parámentros del reforzamiento como son la magnitud, la
inmediatez y la calidad, y tanto para el condicionamiento aversivo como para los programas simples
de refuerzo.
Bauman (1974) identificó 3 errores sistemáticos en situación de elección:

− Sesgos
− Sobreigualación
− Infraigualación
Cabe decir que la Ley de Igualación NO se cumple en los Programas de Razón y que la ley NO explica
porqué se produce alternanza.
- 52 -
TEORÍAS EXPLICATIVAS DE LA CONDUCTA DE ELECCIÓN:
➢ MAXIMIZACIÓN:
Los individuos alternan entre dos fuentes de reforzamiento con tal de lograr el máximo de
reforzadores. Sin embargo, esta teoría NO puede explicar porqué las tasas relativasa de
respuesta se ajustan en la LEY de la IGUALACIÓN.
➢ Teoría de la MEJORA:
Esta teoría propone que los sujetos irán haciendo ajustes en su distribución de respuestas hasta
que las tasas locales de las dos alternativas se igualen. Entonces ya no se puede mejorar la
situación. Esta teoría predice que las distribuciones de las respuestas se ajustan exactamente a
aquello que predice la LEY de IGUALACIÓN.
PROGRAMA CONCURRENTE ENCADENADO:
Un PROGRAMA CONCURRENTE ENCADENADO se da cuando una determinada elección comporta un

compromiso con aquella opción (durante cierto tiempo) y una renuncia a la alternativa.
Se presentan dos alternativas y el sujeto experimental escoje una de ellas. No podrá cambiar a la otra
hasta pasado un cierto tiempo. Pasado este tiempo se le permite una nueva elección.
Una de las opciones ofrece un refuerzo grande pero demorado, mientras que la otra provee un
refuerzo pequeño pero inmediato. Ej: Estamos en casa estudiando y nos llaman los amigos para ver
si queremos salir a dar una vuelta.
Rechlin y Green (1972): Los sujetos experimentales prefieren un refuerzo pequeño pero inmediato.
Ahora bien, cuando se introduce un Tiempo de Demora entre el momento de elecciñon y el acceso
al programa, el resultado es el contrario. Aloraba una especie de autocontrol (tanto en humanos
como en otras especies). La demora resta valor a un reforzador.
Mazu (1987) ha propuesto una función matemática para valorar la pérdida de valor de un reforzador
en función de la magnitud de esta y la demora para conseguirlo. Se llama la FUNCIÓN DEL
DECAIMIENTO HIPERBÓLICO:
V = M / (1 + KD) V = valor del reforzador

M = magnitud del reforzador
D = demora
K = tasa de descuento del valor
Ej: Aplicación a personas que quieren dejar de fumar.
- 53 -
EXTINCIÓN DE LA RESPUESTA INSTRUMENTAL
La EXTINCIÓN es probablemente el método operante más utilizado para reducir y eliminar la

conducta disruptiva.
El procedimiento pasa, en primer lugar, por averiguar qué es lo que está reforzando a la conducta
objetivo y después eliminar ese reforzador.
Muchos pueden ser los motivos (reforzadores) que pueden incitar y mantener las conductas
disruptivas.
Ej: Así el niño puede obtener algunos privilegios como dejar de realizar alguna tarea, ser el
protagonista del grupo en ese momento, reafirmar su liderazgo, etc.
En ocasiones, la conducta no deseable puede ser muy persistente y el reforzador que la mantiene ser
tan inapreciable que es difícil descubrirlo.
Si la conducta NO está reforzada, aquello más adaptativo sería dejar de responder.
La forma en que dejamos de responder es diferente cuando se trata de una máquina de café o bien
cuando se trata de una máquina tragaperras. En el primer caso dejamos de responder enseguida si
no nos sale el vaso de café, pero en el segundo caso podremos observar una resistencia a la extinción.
A este efecto lo llamamos EFECTO DEL REFORZAMIENTO PARCIAL.
Las conductas reforzadas con programas intermitentes son más difíciles de extinguir que las
reforzadas con programas continuos.
Una explicación del Efecto de Reforzamiento Parcial es la llamada Hipótesis de la Discriminación

(Mowrer y Jones, 1945): “Para que un sujeto deje de ejecutar la respuesta una vez se ha iniciado la
extinción es que sea capaz de discriminar el cambio en la contingencia del reforzamiento”.
En un refuerzo continuo el cambio en la contingencia es sencillo de discriminar, en el intermitente

no tanto.
Hay cierta evidencia a favor de una teoría alternativa llamada Teoría secuencial de Cpaldi (Capaldi,
1966, 1967). Esta teoría está formulada en términos de conceptos de memoria. Asume que los
sujetos pueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasado
reciente. El sujeto aprende a responder siempre que recuerde no haber sido reforzado en los ensayos
precedentes.
- 54 -
EFECTOS DE LAS TÉCNICAS BASADAS EN LA EXTINCIÓN:
Las técnicas basadas en la extinción, además de disminuiur la conducta, suelen tener diversos efectos
importantes que debemos conocer:
1. Efectos en la CONDUCTA:
Si la respuesta instrumental efectiva deja de reportar reforzador podemos observar un

incremento de la variabilidad de la conducta.
Ej: Si la máquina proveedora de comida, una vez introducidas las monedas, no nos la
proporciona, puede que provemos a sacudirla, que comprobemos si las monedas han
entrado bien…
Además, la conducta que está sometida a extinción puede aumentar en intensidad, frecuencia
y duración (Ej: las rabietas pueden volverse más violentas, frecuentes y duraderas) cuando
iniciamos la intervención.
Recuperación espontánea: la conducta objetivo, una vez extinguida y cuando ya no es reforzada,

puede ocasionalmente volver a reproducirse.
2. Efectos en la EMOCIÓN → la FRUSTRACIÓN:
En determinadas situaciones puede llegar a generar una cnducta agresiva.
Ej: Si el ascensor se estropea podemos reaccionar clavándole alguna cosa / Conductas agresivas
en el deporte.
Ante la falta de recompensa no somos pasivos, intentamos cambiar el medio.
CONDICIONAMIENTO ADVERSIVO
CONDICIONAMIENTO AVERSIVO: Se utiliza el castigo para reducir una respuesta determinada. Esta
respuesta (conducta) provoca la aparición de un Estímulo Aversivo.
REFORZAMIENTO NEGATIVO:
En el Refuerzo Negativo, si se da la Respuesta Instrumental se produce la finalización del E.Aversivo

o su NO presentación.
Puden aparecer dos conductas:

▪ Escapada: Se puede explicar fácilmente a partir del condicionamiento instrumental.
Si E- inicial, seguidamente R, entonces NO E-
▪ Evistación: NO se puede explicar fácilmente a partir del condicionamiento instrumental.
NO E- inicial, seguidamente R, entonces NO E-
- 55 -
Se han propuesto diferentes explicaciones en este sentido:
1. TEORÍA DE LOS DOS FACTORES: (Mowrer, 1947)
Los 2 factores de la teoría son, por un lado el Condicionamiento Clásico y, por el otro, el
Condicionamiento Instrumental.
1º Condicionamiento Clásico:
EI = Descarga, RI = Miedo, EC = Oscuridad, RC = Miedo
2º Condicionamiento Instrumental:
E = Oscuridad, R = Escapada a un entorno iluminado, C = Reducción del miedo.
Este planteamiento combia la evitación por la escapada. Es sencillo de explicar con el paradigma
del Condicionamiento Instrumental.
Algunas cuestiones plantean retos para esta teoría:

− ¿Cómo es que se mantiene una conducta de evitación cuando ya no hay manifestaciones
de miedo?
− ¿Cómo es que se puede observar una resistencia a la extincion en las conductas de
evitación?
2. TEORÍA DE UN FACTOR: (Sidman, 1953; Hernstein, 1969…)
Esta teoría considera que el Condicionamiento Clásico del miedo NO es necesario para que se
de la respuesta de evitación.
La evitación de la descarga es en si misma un reforzador.
Esta teoría si que puede explicar la resistencia a la extinción de la respuesta instrumental.
3. TEORÍA COGNITIVA: (Seligman y Johnson, 1973)
Consideran que la evitación se realiza en base a las expectativas de resultados o lo que se espera
que suceda.
Si E- inicial, seguidamente R, entonces E-
La respuesta de evitación se mantendrá mientras no se produzca la descarga.
NO E- inicial, seguidamente R, entonces NO E-
¿CÓMO SE PUEDE EXTINGUIR UNA RESPUESTA DE EVITACIÓN?
Pues impidiendo la respuesta de evitación.
Como se está en extinción NO se producirá la descarga eléctrica (E-).
Se genera una discrepancia entre lo que ocurrirá (la NO descarga eléctrica) y lo que se espera que
ocurrá (la descarga eléctrica)
- 56 -
No respuesta de evitación → No presentación del E-
Sistema dopaminérgico: punishment prediction error (Error de predicción del castigo)
RESUMEN COMPARATIVO ENTRE LA ESCAPADA Y LA EVITACIÓN:
REFUERZO NEGATIVO
Escapada Evitación
Contingencia
Negativa Negativa
Respuesta – Reforzador
Consecuencia de la
Elimina un Estímulo Aversivo Impide un Estímulo Aversivo
respuesta
Resultado sobre la
Se mantiene la conducta Se mantiene la conducta
conducta
− Teoría de los 2 Factores
Condicionamiento − Teoría de 1 Factor (Contingencia)
Teorías
Instrumental − Teoría Cognitiva (discrepancia
entre la expectativ y la realidad)
CASTIGO:
Cuando una conducta va seguida de un estímulo aversivo podemos observar un decrecimiento de la

conducta. Ej: Ortigas o alambrada eléctrica.
Skinner (1938) concluyó que el castigo tenía un efecto de supresión de la conducta, pero que este
efecto era temporal.
Azrin (1960). Si el castigo es suave la respuesta se recupera. Cuando el castigo era más intenso se
podía dar un descenso o la completa desaparición de la respuesta a largo plazo. (Otros
procedimientos también generan la supresión de la conducta sin tener que recurrir al castigo, como
la Supresión Condicionada a través del Condicionamiento Clásico Pauloviano).
Schuster y Rachlin (1968) demostraaron que la supresión de la respuesta durante el castigo era
debido a la contingencia entre la respuesta y el estímulo aversivo.
El castigo, por tanto, tendría sobre la conducta efectos opuestos al refuerzo positivo.
FACTORES QUE INFLUYEN EN LA EFICACIA DEL CASTIGO POSITIVO:
1. Es necesario introducir el Estímulo Aversivo con la máxima intensidad desde el inicio. En caso
contrario se puede producir habituación.
2. La eficacia aumenta si el Castigo Positivo se presenta con inmediatez. La demora reduce o
anula la eficacia de suprimir la conducta.
3. Los programas continuos aumentan la eficacia, así como el hecho de que la razón sea lo más
pequeña posible, a la hora de eliminar una conducta.
- 57 -
4. La motivación influye en la eficacia del castigo (si un animal tiene mucho hambre, o poca, o
nada, influirá en la conducta)
¿Cómo suprimir una condcta sin tener que recurrir al castigo con otra intensidad de estímulo
aversivo? Pues hace falta identificar y después devaluarlo. El reforzador se puede dispensar de
forma NO contingente a la conducta que queremos castigar.
Ej: Prestar atención al niño en los momentos en los que se porta bien y no cuando NO se
porta bien, que han estado reforzados hata ese momento con la atención de los padres.
5. Ofrecer Conductas Alternativas a la conducta castigada que proporcione el mismo reforzador
tamién aumenta la eficacia del reforzador.
Ej: En la Modificación de la Conducta, si un terapeuta castiga la conducta de pelearse, a la
vez puede reforzar la conducta coperativa.
6. El papel del Castigo como señal del Reforzador.
Una persona puede aprender que la única forma de recibir refuerzo es siendo castigada.
Entonces buscará situaciones en que se de el castigo. Así explican Azrin y Hotz (1963) el
comportamiento masoquista.
Ej: Solo se recibe la atención de los padres cuando se porta mal.
Factores que afectan la Eficacia del Castigo

− Máxima intensidad del estímulo aversivo.
− Contigüidad temporal respuesta – estímulo aversivo
Incremento de la Eficacia
− Programa de castigo continuo
− Proporcionar alternativas para el refuerzo
− Nivel de motivación alta por el reforzador
Reduce la Eficacia
− Estímulo aversivo como señal de la siponibilidad del reforzador.
FACTORES SECUNDARIOS DEL CASTIGO:
1. El castigo puede generar reacciones emocionales como el miedo o el enfado, que interfieren
en el aprendizaje y en la ejecución.
Experimento de Balaban, Rhodes y Neuringer (1990) en los que se castigaba a unos estudiantes
cuando se equivocaban en una tarea de memoria, a un grupo con una descarga eléctrica y al
otro con un sonido. Los de la descarga iban más lentos y cometían más errores.
2. El castigo puede suprimir otras conductas diferentes a las que se castiga.
Ej: El profesor que castiga las “preguntas estúpidas” estará provocando que tampoco se
formulen otro tipo de preguntas.
Además, supone una gran dificultad en la vida real hacer un seguimiento de las conductas
susceptibles a ser castigadas.
Ej: El niño que es castigado por pegar a su hermano, procurará hacerlo cuando no le vean
y, además, probablemente negará la evidencia cuando le pillen haciéndolo.
3. El castigo puede provocar conductas agresivas ante la persona que lo administra o hacia otras
personas cercanas.
Azrin y Holtz (1963): El castigo NO es recomendable especialmente si hay otras técnicas que
empleen estímulos apetitivos.
- 58 -
Hace falta tener muy en cuenta el aspecto ÉTICO del castigo.
Es importante continuar el estudio debido a que son inevitables muchas situaciones de la vida
cotidiana en las que el castigo aparece (errores en la conducción, olbido del trabajo…)
GENERALIZACIÓN Y DISCRIMINACIÓN
La Generalización y la Discriminación pueden definirse como propiedades de los Estímulos que nos
permiten controlar las Conductas.
Ambas afectan tanto a los Estímulos Condicionados (EC) como a los Estímulos Discriminativos (ED).
De entre todos los estímulos o de todas las características de estos estímulos, solamente algunas de
ellas llegan a tener el Control sobre la Conducta. Sin embargo, en principio sin un entrenamiento
específico cualquier característica podría llegar a adquirir control sobre la conducta.
Experimento de Reynolds (1961) con palomas: Mientras que una paloma se

fijó en el color rojo, la otra paloma se fijó en el triángulo blanco.
▪ GENERALIZACIÓN: Tendencia a tratar 2 Estímulos diferentes como si fueran iguales.

▪ DISCRIMINACIÓN: Tendencia a responder diferente a 2 Estímulos diferentes.
Se trata de dos fenómenos complementarios.
Según Lashley y Wade (1946), la Generalización es la consecuencia de la incapacidad del sujeto para
diferenciar los estímulos. Se daría una confusión entre el estímulo de prueba y aquellos estímulos
utilizados durante el entrenamiento.
Dicho de otra forma, la Generalización es la relación sistemática entre la Fuerza de la Respuesta a los
Estímulos Generalizados y la similitud de estos estímulos con el Estímulo utilizado durante el
entrenamiento original.
Esta relación sistemática se llama Gradiente de Generalización.
GRADIENTE DE GENERALIZACIÓN:
Para estudiar los Gradientes de Generalización se lleva a cabo, inicialmente, una primera fase de
entrenamiento en la que se enseña al sujeto a responder ante un determinado estímulo (Ej: Una luz
de un determinado color).
En un segundo momento (2ª fase, de prueba) se presenta el Estímulo de la prueba y otros estímulos
que varían en el color. En esta fase NO se facilitan Reforzadores. Se registran las respuestas.
Experimento de Guttman y Kalish (1956) con palomas y colores.
- 59 -
Ésta es la distribución típica de los Gradientes de Generalización del Experimento de Guttman y
Kalish:
DISCRIMINACIÓN EXTRA O INTRADIMENSIONAL:
En algunos estudios se utiliza 1 solo Estímulo Discriminativo o E+ (si hay presencia de E+, entonces
encontramos también Reforzador; si NO hay E+, entonces NO hay tampoco Reforzador).
En otros procedimientos se utilizan 2 Estímulos diferentes para indicar cuándo hay y cuándo NO hay
Reforzador.
El Estímulo que señala el NO Reforzamiento se llama E-.
▪ DISCRIMINACIÓN EXTRADIMENSIONAL: Cuando los Estímulos Discriminativos se diferencian a

partir de características de estimulación distintas.
▪ DISCRIMINACIÓN INTERDIMENSIONAL: Cuando los Estímulos Discriminativos se diferencian a
partir de una misma característica de estimulación.
Los experimentos con una Discriminación Intradimensional (Ej: un tono de 1000Hz – E+ – y un tono
de 950Hz – E- –) producen la discriminación más afinada.
LA TRANSPOSICIÓN Y EL DESPLAZAMIENTO DEL VÉRTICE:
El experimento de Kohler (1939) con pollitos y distintos tonos de color demostró que los animales
podían aprender a manipular conceptos abstractos.
Acababan escogiendo el gris más claro, lo que indicaba que habían aprendido, no a escoger el mismo
color sino que habían aprendido que necesitaban escoger el color más claro, aunque no coincidiera
- 60 -
con el estímulo empleado con anterioridad. La hipótesis relacional se impuso a la hipótesis absoluta.
Este fenómeno recibe el nombre de TRANSPOSICIÓN.
Por lo tanto, se observa que el individuo responde no en función de las características de cada
estímulo, sino en función de la relación entre estos (que la “traspone” o aplica de la relación
aprendida anteriormente).
El Desplazamiento del Vértice del Gradiente de Generalización se refiere al alejamiento del máximo
del Gradiente de Generalización respecto al E+ original y en dirección opuesta al E-.
Fenómeno que demostró Hanson (1959), el cual se pude observar después de un entrenamiento
previo de discriminación simultánea en el que se utiliza un procedimiento en el que se refuerza una
conducta ante un estímulo (E+) y no ante otra (E-), y también en estudiar posteriormente el gradiente
de generalización.
Lo que caracteriza este gradiente (es lo que conocemos como desplazamiento del vértice) es que la
tasa más elevada de respuestas se observa ante un estímulo diferente del estímulo que previamente
se había reforzado, el estímulo ante el que el sujeto emite un número mayor de respuestas se
“desplaza” en sentido inverso al estímulo que había aprendido previamente a no responder (E-).
LA TEORÍA DE SPENCE (1936):
Se trata de una teoría que puede explicar de forma elegante los fenómenos de Transposición y
Desplazamiento del Vértice.
Punto de partida: Los sujetos experimentales aprenden solo sobre los estímulos de forma individual
y NO aprenden nada respecto a las relaciones entre ellos. En un entrenamiento Intradimensional, el
E+ adquiere fuerza excitadora y el E- adquiere fuerza inhibitoria.
Segundo supuesto de Spence: Ambas fuerzas (E+ y E-) forman sus respectivos Gradientes de
Generalización Excitatorio e Inhibitorio (este último demostrado por Honig, Boneau, Burstein y
Pennypacker, 1963).
Spence afirma que en el continuo Intradimensional algunos valores se verán afectados por fuerzas
excitadoras e inhibidoras simultáneamente, que se contrarrestarían.
Representación Gráfica de los Gradientes de Generalización

Excitador (Línea Azul) e Inhibidor (Línea Roja) en torno a los
Estímulos E+ y E- respectivamente. La Línea Negra representa
la fuerza excitadora neta de las fuerzas excitadoras e
inhibidoras.
- 61 -
LA TEORÍA DE LA DISCRIMINACIÓN BASADA EN PROCESOS DE ATENCIÓN:
En la naturaleza, los Estímulos que debemos discriminar NO son puros y pueden variar en más de una
dimensión.
Shutherland y Mackintosh (1971) consideran que el aprendizaje de la Discriminación depende de 2

procesos:
1. Proceso de ATENCIÓN:
Atendemos a una dimensión que sobresale (brillo o color, por ejemplo). Si esta es reforzada
estaremos más atentos. Si no es el caso, estaremos atentos a otra dimensión que, si resulta
relevante para obtener el reforzador, hará que tendamos a estar más pendientes.
2. Proceso de ADQUISICIÓN de RESPUESTA:

En el caso de una discriminación, la respuesta sería la elección del valor de la dimensión que
provoca el reforzamiento. El experimento de Mackintosh y Little (1969), con palomas, aporta
evidencia a favor de la teoría.
APRENDIZAJE PERCEPTIVO:
Según Gibson y Walk (1956), “la sola exposición a los estímulos complejos (por ejemplo triángulos o
círculos) es suficiente para facilitar la discriminación entre estímulos.”
El efecto es robusto y no es necesaria una exposición larga ni tampoco que los animales sean jóvenes.
Esta facilitación se llama Aprendizaje Perceptivo.
Gibson (1969): "La exposición a los estímulos antes del entrenamiento permite a los sujetos extraer
las características diferenciadoras".
McLaren, Kaye y Mackintosh (1989, 2000) proponen una Teoría Asociativa del Aprendizaje
Perceptivo. “Todo estímulo está formado por varios elementos. Cuando comparten muchos
elementos en común, la discriminación entre ellos será difícil”.
APRENDIZAJE POR OBSERVACIÓN
Buena parte del Aprendizaje Humano se realiza por Observación.
Bandura i Walters (1963): “Observamos la conducta de los demás, observamos las consecuencias y,
posteriormente, imitamos sus conductas”.
El enfoque tradicional del aprendizaje es incumplido.
PERSONALIDAD = HERENCIA + (sobre todo) EXPERIENCIAS PERSONALES DE APRENDIZAJE
Estas experiencias (1ª infancia, ...) siguen los principios de la Teoría del APRENDIZAJE SOCIAL: las
conductas se aprenden a través del Condicionamiento Clásico, del Condicionamiento Instrumental y
del Aprendizaje por Observación o Imitación.
- 62 -
TEORÍA DE LA IMITACIÓN:
1. LA IMITACIÓN COMO INSTINTO:
Varios autores (Baldwin, James, McDougall, Morgan...) han considerado que existe una
tendencia innata a imitar.
Experimentos de Meltzoff y Moore (1977, 1983) encontraron que los niños de entre 12 y 21 días
ya imitaban 4 gestos que habían escogido para su investigación.
Parecería que los humanos nacemos con la capacidad de asociar determinadas entradas
sensoriales (la visión de un adulto haciendo un determinado gesto sensorial) con un conjunto de
movimientos musculares que permiten al niño realizar el mismo movimiento que ven.
¿Se trata de un fenómeno exclusivamente humano? → Thorndike encontró que NO. Robert
(1990) reunió más de 200 estudios sobre Aprendizaje Observacional con otras especies.
Thorpe (1963) propuso 3 categorías de Aprendizaje Observacional:
▪ FACILITACIÓN SOCIAL: El comportamiento de un individuo provoca una conducta similar en

otro, pero la conducta ya se encuentra en el repertorio del imitador.
▪ AUMENTO LOCAL: La conducta de un animal dirige la atención hacia un determinado objeto
o lugar del entorno. Una conducta que podría aprenderse por ensayo y error se aprende
más rápidamente.
▪ IMITACIÓN AUTÉNTICA: Imitación de un patrón de conductos que es muy poco probable
que aparezca en una determinada especie y que raramente puede ser aprendida por ensayo
y error.
Kawai (1965) habla de la observación de cómo los monos japoneses limpiaban la tierra de una
especie de boniatos. También se ha observado en aves.
2. LA IMITACIÓN COMO UNA RESPUESTA INSTRUMENTAL:
Dollard y Miller (1941) consideraron que la imitación es una forma de Respuesta Instrumental.
La conducta del modelo sería el Estímulo Discriminativo y la Respuesta Reforzada sería la misma
o muy similar a la que ofrece el modelo.
Hay que ser prudentes a la hora de aceptar esta teoría ya que sólo sería viable en situaciones en
las que el aprendiz observa el comportamiento del modelo, copia de inmediato la conducta y
recibe el reforzamiento para hacerlo.
El propio Bandura (1969) hace notar que muchas de las conductas aprendidas por observación
NO siguen ese patrón.
Podemos explicar la aparición de nuevas conductas recurriendo al concepto de Generalización.
Muchas nuevas conductas son variaciones de respuestas similares previamente reforzadas.
- 63 -
Experimento de Lashley (1924) con ratas que debían andar sobre agua y después debían nadar
para alcanzar el reforzador.
Ejemplos también en humanos.
3. LA TEORÍA DE BANDURA SOBRE EL APRENDIZAJE POR IMITACIÓN:
Experimento de Bandura (1965) sobre comportamiento agresivo (reforzado, castigado o sin

consecuencias) con niños de 4 años, un modelo adulto y un juguete (tozudo o saltamontes).
Bandura encontró 2 aspectos que NO podían ser explicados por la Teoría de la Generalización
de la Imitación:
a) Las consecuencias que reciben los modelos influían en la conducta de los niños.
− Los del modelo reforzado: MÁS agresivos.
− Los del modelo castigado: MENOS agresivos.
b) Cuando Bandura reforzaba los 3 grupos para imitar el modelo de una película, los 3 grupos
mostraban MUCHA CONDUCTA AGRESIVA.
Bandura concluyó que NO era necesario el Refuerzo para aprender una conducta a través de la
observación, pero SÍ que se necesitaba que la conducta se ejecutara.
APRENDIZAJE diferente a la CONDUCTA (Esta distinción NO la hace la Teoría de la Generalización

de la Imitación y por este motivo NO puede explicar algunos resultados que se producen).
Bandura (1969, 1986) propone Teoría Cognitiva del Aprendizaje por Observación, a partir de la
cual identifica 4 procesos implicados:
▪ Procesos de ATENCIÓN: El aprendiz debe estar atento a las características relevantes de

la conducta del modelo.
▪ Procesos de RETENCIÓN: El aprendiz debe retener la información adquirida durante la
observación si después quiere reproducir la conducta.
▪ Procesos de REPRODUCCIÓN MOTRIZ: Es necesario que el aprendiz tenga las capacidades
motrices necesarias para reproducir la conducta.
▪ Procesos de MOTIVACIÓN y de INCENTIVO: Para que la conducta se ejecute el aprendiz
debe tener la expectativa de que será reforzada.
FACTORES QUE AFECTAN A LA PROBABILIDAD DE IMITACIÓN:
1er Factor: + imitación cuando el modelo ha sido reforzado

2º Factor: + imitación cuando uno mismo ha sido reforzado por la imitación
CARACTERÍSTICAS DEL MODELO:
− Las personas que proporcionan más refuerzo, tanto afectivo como de otros tipos, tienden a
ser más imitadas. Experimento de Bandura y Huston, 1961.
− Las personas que tienen más poder sobre el imitador tienden a ser más imitadas. El concepto
de PODER o CONTROL equivale al de Dominancia en el grupo social. Experimento de Mischel y
- 64 -
Grusec (1966) con la nueva profesora titular o profesora visitante. También con el niño
dominante o una cheer-leader.
− Similitud entre el Modelo y el Observador.
− Sinceridad del Modelo. Se imita más aquel modelo que parece más sincero. La Teoría de la
Generalización de la Imitación considera que cada una de estas variables reflejan los efectos
de la experiencia pasada del niño pero, por el contrario, la Teoría de Bandura del Aprendizaje
por Imitación considera que reflejan las expectativas que tiene el niño de refuerzo futuro.
CARACTERÍSTICAS DEL APRENDIZ:
− Los niños tienden a imitar más las conductas agresivas que las niñas.
− Los niños pequeños (4 años) imitan más que niños mayores (9 años).
− Los niños dominantes (a los que se imitaba más) tendían a mostrar mayor conducta imitativa.
− Las personas menos seguras tendían a imitar más el comportamiento de los demás.
Experimento de Roberts, Boone y Wurtele, 1982
CARACTERÍSTICAS DE LA SITUACIÓN:
− Las situaciones ambiguas provocan más inseguridad y, por tanto, más imitación. Experimento
de Thelen, Paul y Dollinger, 1978
− A mayor dificultad de la tarea, mayor imitación.
− La forma de presentar el Modelo NO era una característica significativa (Bandura, 1962)
FOBIAS: No hay demasiado apoyo a la idea de que el Aprendizaje por Observación esté en la base
del desarrollo de fobias.
CONDUCTOS DE ADICIÓN (tabaco, alcohol, drogas): El mantenimiento de estas conductas se puede

explicar a partir de los principios del Refuerzo y el Castigo, pero su adquisición puede explicarse
mediante el Aprendizaje por Observación.
INFLUENCIA DEL APRENDIZAJE POR OBSERVACIÓN EN EL DESARROLLO COGNITIVO:
Los teóricos del Aprendizaje Social (Rosenthal y Zimmerman, 1972, 1978) defienden que el
Aprendizaje por Observación es el principal mecanismo para el desarrollo de habilidades cognitivas.
Ejemplo de un experimento con niños de 7 años respecto a la labor de conservación.
También se han observado mejoras en la adquisición de reglas gramaticales, conceptos abstractos y

solución de problemas.
Bandura ha sugerido que el Aprendizaje por Observación puede influir en el juicio de los niños en
relación a qué conductas son buenas y qué malas (Bandura y McDonald, 1963)
El aprendizaje por observación como herramienta en terapias de conducta y para facilitar conductas
con baja probabilidad de aparición, la adquisición de nuevas conductas, la eliminación de miedos y
deconductos no deseadas.
- 65 -
APLICACIONES DEL
CONDICIONAMIENTO INSTRUMENTAL
La aplicación profesional y sistemática del Condicionamiento Instrumental u Operante se inicia en la
década de los 50 del siglo pasado a partir de los trabajos de Skinner.
Se aplican en principio con el propósito de Modificar la Conducta de niños autistas, de personas con
retraso mental, psicóticas o con otras problemáticas como el consumo de tabaco y varias drogas.
También en la escuela: comportamientos inapropiados, bajo rendimiento académico, etc.
Y en el ámbito laboral para aumentar la productividad o reducir el absentismo.
También en entornos carcelarios y penales: reducir las conductas antisociales y promocionar el

comportamiento cívico.
En terapia de pareja para mejorar la comunicación y favorecer sus relaciones positivas.
Y para potenciar la relajación en personas que sufren de dolor de cabeza, por poner un ejemplo.
INTRODUCCIÓN DE CONDUCTAS ADAPTATIVAS:
En un principio se dudaba de si las técnicas derivadas del Condicionamiento Instrumental serían

efectivas para el tratamiento de psicopatologías graves, pero se comprobó que sí, así como para la
promoción de comportamientos deseables.
ÁMBITO ESCOLAR
Se utiliza el Condicionamiento Instrumental para fomentar conductas adaptativas así como disminuir
las desadaptativas como hablar mucho y en voz alta, levantarse del sitio, molestar a los compañeros,
etc...
Un segundo propósito tiene que ver con la mejora de rendimiento académico.
Aplicación de programas (Skinner, Keller,…) que plantean la partición de los contenidos académicos
en pequeñas unidades o pasos; además, permiten que cada estudiante siga su propio ritmo de
aprendizaje para evitar en lo posible los fracasos, proponen controles frecuentes y no penalizar los
fracasos sino volver a trabajar la materia no superada, proporcionar de forma inmediata
retroalimentación sobre el rendimiento y reforzar el logro y las respuestas correctas.
MEJORA DEL RENDIMIENTO DEPORTIVO EN NIÑOS: Se refuerzan pequeños hitos y se va

incrementando progresivamente el Desafío y el Reto.
- 66 -
ESTRATEGIAS PARA LA MODIFICACIÓN DE LA CONDUCTA EN EL AULA:
Según Martin y Pear (2007), la modificación de conducta implica la aplicación sistemática de los
principios y técnicas de aprendizaje para evaluar y mejorar los comportamientos encubiertos y
manifiestos de las personas y facilitar así un funcionamiento favorable.
FASES DE UN PROGRAMA DE MODIFICACIÓN CONDUCTUAL:
1. Identificar la conducta
2. Evaluación previa al tratamiento: se hace una evaluación conductual para saber la dimensión
del problema antes de la introducción del programa de modificación de conducta. Supone la
recogida y el análisis de datos e información para identificar y describir los objetivos
comportamentales, especificar las causas probables del comportamiento, elegir las estrategias
de intervención más adecuadas para modificarlo y evaluar los resultados del tratamiento.
3. Fase de tratamiento: se instaura un programa para conseguir la mejora de esta conducta. Los
programas de modificación de conducta implican la observación y el registro continuo del
comportamiento a lo largo del tratamiento.
4. Fase de seguimiento: se observa atentamente si se mantienen los avances conseguidos en el
tratamiento una vez concluido.
Si queremos cambiar una conducta inadecuada o enseñar algo nuevo, lo primero que debemos hacer
es identificarla tan objetivamente como sea posible.
Para ello, debemos definirla en términos específicos que requieran un mínimo de interpretación, es
decir, de forma clara, de modo que pueda ser observada (medida y registrada) por personas
diferentes sin necesidad de hacer suposiciones y/o valoraciones subjetivas.
En consecuencia, cualquier intento de eliminar o disminuir una conducta que simultáneamente no

premie las conductas incompatibles será un fracaso.
Por eso, conocer la relación que existe entre la conducta y sus consecuencias , tipos de consecuencias
y cómo utilizarlas es fundamental para garantizar una enseñanza.
Características de la conducta a registrar: Es necesario observar la conducta considerando la

frecuencia, la duración, la intensidad, los ambientes donde se presenta, entre otras características.
ESTRATEGIAS PARA REGISTRAR LA CONDUCTA:
▪ Registro continuo: Recoge todas las apariciones del comportamiento durante un período
concreto.
▪ Registro por intervalos: Se selecciona un período específico en el que se observará y registrarán
todas las apariciones del comportamiento.
▪ Registro de intervalo parcial: Sólo se registra la conducta de forma dicotómica (si aparece la
conducta en un intervalo de tiempo concreto o no aparece).
- 67 -
▪ Registro de intervalo completo: Sólo se registra la conducta si persiste durante un intervalo de
tiempo completo.
▪ Registro de muestreo temporal: Se puntúa una conducta como presente o ausente en
intervalos de tiempos breves y temporales.
▪ Muestreo temporal momentáneo: Registro dicotómico de momentos puntuales, como por
ejemplo; las horas en punto.
▪ Observación y registro: Se puede dar un tiempo breve para observar y el mismo para registrar
las conductas.
a) TÉCNICAS OPERANTES DIRIGIDAS A AUENTAR LA AMISIÓN DE CONDUCTAS
➢ REFORZAMIENTO:
Su finalidad es aumentar conductas positivas o deseadas (estudiar, obedecer al maestro, no

hablar en clase, participar…)
Tener en cuenta el factor de contigüidad temporal (muy importante en alumnos pequeños y

alumnos con necesidades específicas).
Para iniciar un programa de reforzamiento es necesario usar un reforzamiento continuo, para

después ir espaciándolo gradualmente (reforzamiento intermitente) hasta su consolidación.
Los reforzadores no son universales.
A la hora de establecer un reforzador debe tenerse en cuenta:

− Edad, intereses y preferencias de la persona a la que irá dirigido (ej: caramelo a los 3 años)
− La conducta que se quiere reforzar (ej: 0,1 puntos vs. 2 puntos)
− Intentar usar reforzadores novatos.
− Intentar usar reforzadores naturales, es decir, reforzadores que estén disponibles sin
necesidad de introducirlos (ej: juego después de hacer una ficha educativa)
− Tener en cuenta el principio de Premark.
− Uso simultáneo de reforzadores resulta más efectivo
TIPO DE REFORZADORES:
▪ Reforzadores de consumo: El tipo de alimentos que le gusta comer; los tipos de bebida
que le gusta consumir (leche, refrescos, zumos, otros).
▪ Reforzadores de actividad: Qué le gusta hacer: pasatiempos, trabajos, recoger juguetes,
arreglar las sillas, manualidades, área de tacos, actividad al aire libre, deportes, jardinería,
jugar, ir al parque, etc.
▪ Actividades pasivas: Ver la televisión, escuchar música, charlar, escuchar cuentos.
▪ Reforzadores de manipulación: Qué tipo de juegos o juguetes le interesan: coches,
muñecos, juguetes de cuerda, pelotas, rompecabezas, silbidos, saltar la cuerda, libros
para pintar, pintar, entre otros.
- 68 -
▪ Reforzadores sociales: Qué tipo de estimulación le gusta recibir y de parte de quién:
1. Estimulación verbal: Buen chico!, Bien hecho!, Buen trabajo!, Muy bien!, Sigue así!
2. Contacto físico: un abrazo, un beso, cosquillas, choca cinco (palmadas), balancearse
sobre las rodillas del maestro.
La única forma de saber si una contingencia es reforzante es observar si fortalece la conducta

que se sigue o no.
Es básico registrar la conducta y analizar los efectos que se derivan de la consecuencia

administrada.
Si el reforzamiento no funciona, debería analizarse:

− ¿Se administró inmediatamente después de la conducta?
− ¿Fue contingente?
− ¿La conducta ha sido reforzada cada vez?
− ¿Conoce el reforzador? Ofrecer una muestra.
− Posibilidad de utilizar otro reforzador.
La atención social es un caso especial de reforzador. Por atención se entiende los reforzadores
positivos o negativos administrados intencionadamente o involuntariamente cómo son los
comentarios, gestos, miradas, elogios, censuras, y toda expresión que tienda a premiar o castigar
la conducta.
La aprobación y la atención social parecen una estrategia muy sencilla de utilizar, simple y de
sentido común. Pero a veces es difícil empezar a utilizarla sin recurrir a la estrategia de regañar
o castigar. Intentamos motivar a los demás de un modo negativo (ejemplo atención social).
Ej: que ocurre cuando una conducta se ignora. ¿Qué ocurre al principio? Cómo evoluciona…
Muchas veces no es suficiente sólo con las palabras, pero estas siempre deben acompañar la
entrega de un refuerzo.
ECONOMÍA DE FICHAS:
En clase, la entrega de reforzadores debe estructurarse ya que se suelen introducir para

controlar a los niños más problemáticos, pero todo el grupo debe tener acceso a ellos.
Una forma de hacerlo es mediante la Economía de Fichas: Un programa en el que un grupo de

niños puede ganar fichas para emitir conductas deseables, y en las que las fichas pueden ser
canjeadas por reforzadores de soporte.
Es un caso especial de la aplicación del refuerzo y de la extinción. En lugar de utilizar los premios
o los reforzadores directamente, se utilizan fichas que después se intercambiarán por una
variedad de actividades agradables y bienes de consumo.
Los privilegios utilizados como premio sólo se pueden obtener a través de fichas y, si es
necesario, las conductas indeseables se eliminan empleando la técnica de la pérdida contingente
de éstas.
- 69 -
VENTAJAS:
− Pueden administrarse inmediatamente después de que se dé un comportamiento

deseable para ser canjeados por un reforzador de soporte.
− Evita el problema de la saturación.
− No interrumpe la conducta y enseña autocontrol (demora el reforzamiento).
PASOS INICIALES:
1. Decidir las conductas metas, que vienen determinadas por: el tipo de niños con que se
trabaja, por los objetivos a corto y largo plazo que se pretenden conseguir, y por los
problemas comportamentales específicos que pueden interferir con la consecución de
estos objetivos.
2. Registrar la línea base, se parte de que el sujeto pueda emitir la conducta deseada.
3. Seleccionar el tipo de ficha a utilizar (Ej: monedas de chocolate, sellos, caramelos,
gomets…)
4. Identificar la ayuda disponible, con otros niños, maestros auxiliares…
5. Elegir el sitio o sitios para aplicar la.
➢ MODELAJE:
Se trata de favorecer el desarrollo gradual de una conducta mediante el hecho de reforzar

repetidamente pequeñas mejoras o aproximaciones a la conducta final (objetivo).
En vez de esperar al momento en que se dé una conducta nueva en su forma final, reforzamos
cualquier parecido de esta nueva conducta.
Se utiliza sobre todo para conductas que todavía no forman parte del repertorio habitual del
sujeto.
- 70 -
El cambio en la pauta de reforzamiento es el elemento esencial del proceso de modelado, ya
que se deja de reforzar una conducta una vez se observa otra que la mejore y la supera.
Se trata de reforzar la mejora no la perfección.
En ocasiones la conducta objetivo no ha sido subdividida en suficientes pasos. En estos casos es

necesario revisar la secuencia y dividir la conducta de modo que la exigencia sea más pequeña.
Hay que tener cierta paciencia, ya que muchas veces se utiliza con personas que aprenden
lentamente o que presentan dificultades.
Se utiliza principalmente con personas con deficiencia y se ha logrado buenos resultados en

conductas de higiene personal y en la adquisición del lenguaje.
➢ ENCADENAMIENTO:
El objetivo es la formación de una conducta a partir de otras más sencillas que ya figuran en el
repertorio del sujeto, mediante el reforzamiento de sus combinaciones, es decir, se trata de
conseguir una unidad funcional que está formada a partir de unidades conductuales
preexistentes, por lo que subsumen en una nueva conducta.
En primer lugar, debe analizarse la conducta que se quiere conseguir, para especificar su función
y las conductas componentes. El nivel de detalle de estas dependerá de la tarea y de los
repertorios conductuales que tenga el sujeto, por tanto, debe saberse de qué fragmentos de
conducta dispone.
En el encadenamiento se puede empezar tanto por el principio como por el final.
Esta técnica se utiliza en conductas que el sujeto conoce pero no sabe cómo puede hacerlas, por
ejemplo, en el desarrollo de habilidades domésticas (vestirse, comida, higiene personal, etc.).
TIPOS:
▪ Encadenamiento hacia adelante: Se sigue el orden de presentaciones del principio al final

(ej: conducir un coche).
▪ Encadenamiento hacia atrás: Se empieza en el último paso (ponerse los pantalón –
cremallera – abrochar el botón…)
- 71 -
▪ Presentación completa de la tarea: Repetición de toda la cadena de conductos en cada
intento.
Ej 1: Análisis de tareas.
Ej 2: Podemos hacer que la merienda se convierta en la última etapa de la conducta (por

tanto en recompensa o premio) si primero deja las cosas del colegio en su habitación y
después se pone los zapatos de descanso y se lava las manos.
➢ CONTRATO DE CONTINGENCIA O CONTRATO CONDUCTUAL:
Es un acuerdo que se formaliza por escrito entre dos o más personas, en el que se especifican
las conductas que deberá ejecutar cada una de las partes y las consecuencias que se derivarán,
así como del incumplimiento del acuerdo que recoge el contrato.
Implica el intercambio recíproco de recompensas contingentemente en las conductas

especificadas en el contrato.
Lo importante, es que quede bien claro qué consecuencias se derivarán del cumplimiento o
incumplimiento de las condiciones (conductas) pactadas en el contrato.
CARACTERÍSTICAS:
• Los contratos deben ser específicos.

• Deben incluir la siguiente información:
− Quién (la persona que debe hacer la conducta y la persona que da la consecuencia)
− Qué (la conducta especifica y la consecuencia que se derivará)
− Cuándo (pasará, y se dará la consecuencia)
− Características tanto de la conducta como de la consecuencia (intensidad, duración,
topografía, personas involucradas, etc.)
• Es necesario escribirlos en términos positivos (conducta deseada).
• Tienen que tener un inicio y un final.
• Pueden ser renegociados o extinguirse al final del contrato.
Escribir y firmar el contrato siempre es una manera de dar énfasis a lo que se intenta hacer, y
además, nos aseguramos que los acuerdos no van a depender de interpretaciones ni del
recuerdo de las partes.
Asegurar que pueda tenerse éxito en su realización.
- 72 -
Conviene incluir bonificaciones adicionales si la persona supera el mínimo del contrato, así lo
hará lo mejor posible.
Debe ser negociado y correcto por ambas partes y debería ser posible la renegociación.
Se debería eliminar una vez se han establecido nuevas pautas de conducta y de reforzamiento.
Uno de los objetivos debería ser disminuir la dependencia sobre el contrato y mantener las
nuevas conductas y los refuerzos de una forma informal en el ambiente natural.
b) TÉCNICAS OPERANTES DIRIGIDAS A REDUCIR LA EMICÓN DE CO NDUCTAS
➢ EXTINCIÓN:
La extinción es probablemente el método operante más utilizado para reducir y/o eliminar la
conducta disruptiva. Consiste en suprimir el reforzamiento de una conducta previamente
reforzada.
Hay que ser constante y perseverar.
Al principio puede ocurrir que haya un aumento en la intensidad, en la duración o en la

frecuencia de la conducta que se quiere eliminar, incluso, un aumento de respuestas agresivas.
No es una técnica recomendada si se desea tener un resultado inmediato.
La recuperación espontánea es compatible si no existe una combinación con el reforzamiento

de conductas incompatibles.
LA RETIRADA DE ATENCIÓN: Esta técnica supone una aplicación del principio de extinción, en
especial para aquellas conductas que se manifiestan con desobediencia, desafío o también (en
niños más pequeños) con rabietas, llantos… pero sin llegar a ser manifestaciones excesivamente
agresivas.
Por ejemplo, un niño pequeño que está acostumbrado a ser el protagonista (todos los adultos
le prestan atención) cuando lleva a cabo una rabieta, es muy probable que si se le deja de
prestar atención (excepto caso de fuerza mayor) y su escenificación pasa por no tener
espectadores, esa conducta tienda a reducirse o desaparecer.
Por ejemplo, sólo lloran cuando se caen si los adultos miran.
Muchos niños en clase pueden desarrollar recursos desadaptados para llamar la atención del
maestro/a. En caso de conseguirlo esta conducta quedará muyu reforzada.
La mejor solución es obviar las conductas no deseadas (en la medida de lo posible) con la retirada
de atención para dársela a medida que la conducta vaya mejorando.
La idea no es transmitir: "Cómo te portas mal no me interesas", sino: "Si haces las cosas
correctamente puedo estar más contigo".
- 73 -
Hay situaciones en las que la retirada de atención, tal y como se ha planteado, no puede ser
aplicable dado que van acompañadas de conductos más subidas de tono como lanzamientos de
objetos o deambulación por el aula.
De todas formas, en general, el mantener la “compostura” durante un incidente, sin prestar

atención a las conductas disruptivas (excepto necesidad de contención o riesgo para terceros),
utilizar un tono de voz calmado pero firme, sin estridencias, es un buen método para ayudar a
su extinción.
RECOMPENSAR CONDUCTAS INCOMPATIBLES a la que se quiere suprimir. Se trata de un

procedimiento más efectivo que el castigo. Algunas situaciones necesitan ser tratadas con
reforzamiento, pero añadiendo alguna forma no invasiva de castigo como en diferentes
tratamientos de omisión (Por ejemplo, con hijos con condctas antisociales graves).
REFORZAMIENTO DIFERENCIAL DE OTRAS CONDUCTAS (RDO): Hace falta reforzar cualquier

comportamiento menos aquel que se quiere eliminar. Se refuerza al sujeto en sí, pasado un
tiempo estipulado, NO tiene que efectuar la conducta que se quiere suprimir. (Investigación de
Lowitz y Suib, 1978: Erradicar la conducta de chuparse el dedo → Refuerzo de unos céntimos
cuando pasaba 1 minuto sin que se hubiera ejecutado la conducta).
➢ COSTE DE RESPUESTA O CASTIGO NEGATIVO:
Consiste en retirar una consecuencia positiva contingente a la emisión de la conducta. Es decir,

se peirde un refuerzo positivo adquisido anteriormente por emitir una conducta inadecuada que
se pretende eliminar.
Se retira un reforzamiento (Ej: dinero o puntos) cada vez que se produce la conducta objeto del
tratamiento. Ejemplos de la vida cotidiana serían las multas o las retiradas de puntos del carnet
de conducir cuando se cometen infracciones de tránsito.
Estudio de Reynolds y Kelley (1997) con 4 preescolares con comportamientos agresivos, y de

Lippmann y Motta (1993) con internos psiquiátricos crónicos.
Es aconsejable utilizar lo conjuntamente con el refuerzo positivo de la conducta deseable y de

conductos incompatibles.
Al aplicarla es importante evitar que la persona pierda todos los reforzadores, sobre todo al
principio, y que el coste de la respuesta por la conducta inadecuada pueda ser fácilmente
reemplazado.
Los sujetos deben saber el coste de la conducta que tendrá la realización de la conducta a
eliminar.
Por ejemplo para un niño puede resultar muy desagradable quedarse sin patio durante unos
días, no poder jugar al fútbol con su equipo de la escuela o perderse la clase de informática para
repasar matemáticas. También dejar de ir a una excursión o no poder participar en una actividad
colectiva.
- 74 -
Una conocida técnica con la que también puede aplicarse el coste de la respuesta es la Economía
de fichas, donde al niño se le retiran algunos puntos o fichas que son intercambiables por
reforzadores naturales (chucherías, juguetes…)
➢ TIEMPO FUERA DEL REFORZAMIENTO (TIME OUT):
Se trata de retirar las condiciones del medio que permitan la obtención del reforzamiento o
quitar a la persona del medio, durante un período determinado, de manera contingente a la
realización de una conducta desadaptada.
Se recomienda utilizarlo conjuntamente con el refuerzo positivo de conductas alternativas.
En situaciones normales, lo que se intenta con esta forma de proceder es retirarlo a un espacio
poco interesante y alejado de otras actividades.
Lo ideal sería que fuera un lugar donde el niño no tuviera otro tipo de posibilidad que no fuera
aburrirse soberanamente. Se trata de aislarlo de posibles refuerzos positivos (hablar con sus
compañeros, dejar de realizar alguna actividad interesante...).
Llevar a la persona (normalmente se trata de un niño) a un ambiente o contexto menos

agradable que aquel en el que se encientra cuando realiza la conducta indeseada.
Estudio de Rortvedt y Miltenberger (1994) con dos niñas de 4 años que desobedecían de forma
continuada las demandas de su madre. Se reforzó a las niñas cuando hacían lo que tenían que
hacer, pero se les ponía en otro lugar durante 1 minuto de cara a la pared sentadas cuando
desobedecían. La mejora se mantenía 8 semanas después.
… Complicado en la vida real.
PARA APLICAR ESTA TÉCNICA ES NECESARIO LO SIGUIENTE:
1. Asegurarse de que el sujeto puede llevar a cabo la conducta alternativa a la que se quiere
eliminar.
2. Ser consistente en aplicarla.
3. Arreglar una zona en la que se pueda aislar a la persona sin que se pueda entretener
haciendo otras conductas que le resulten agradables. Zona cercana para poder ponerlo
en práctica de manera contingente.
4. Realizarlos de una duración moderada cuando se usa con niños. Se comienza con períodos
breves, que si no son eficaces, se pueden ir alargando.
5. Dar un aviso previo a la aplicación del tiempo fuera del medio y señalar que realiza la
conducta inadecuada.
6. Recordar el final del tiempo fuera. Volver al medio al terminar el tiempo definido. Si sigue
haciendo la conducta inadecuada avisarle de que puede continuar más tiempo en este
sitio hasta que sea capaz de dejar de hacerlo.
- 75 -
➢ PRÁCTICA MASIVA (SADOLLAMENT):
Se trata de presentar un reforzador de forma tan masiva que pierda su valor:
− Haciendo que el sujeto ejecute la conducta que se quiere eliminar de una forma masiva.
Por ejemplo, fumar muy rápidamente e intensamente y terminar el cigarrillo en 5
chupadas. O un niño que sólo quiere comer patatas fritas. Se le da sólo esto para el
desayuno, almuerzo, merienda y cena. Hasta que le produzca saciedad.
− Proporcionando el refuerzo que mantiene la conducta en tanta cantidad o durante tanto
tiempo que pierda el valor de recompensa.
Hay que tener mucho cuidado en el diseño de las sesiones porque si no se es eficaz en la
inducción a la aversión, entonces podría reforzarse esta conducta. Por tanto, la práctica debe
ser lo suficiente masiva para que resulte aversiva para el sujeto.
➢ CASTIGO POSITIVO:
Es la aplicación de un acontecimiento contingente aversivo a la conducta que se quiere suprimir.
Hace falta que sea el últimi recurso debido a los efectos colaterales perjudiciales que produce.
CONDICIONES PARA APLICARLO:
− Cuando se trate de comportamientos absolutamente indeseables.

− Cuando han fracasado intentos más benébolos.
− Con la intensidad efectiva más baja posible.
− Aplicación consistente, inmediara y justificada en todos los contextos.
Acostumbran a se bastante efectivos si se aplican correctamente. Se ha aplicado sobre todo en

animales, pero parece que también funciona perfectamente en humanos. Se utiliza casi siempre
acompañado de otras técnicas.
Investigación de Lovaas y Simmons (1969) con autistas con conductas autolesivas grabes. Se les
administraban descargas eléctricas controladas. Se emplean los SIBIS (Self-Injurious Behaviour
Inhibiting System) o Sistema de Inhibición de la Conducta Autolesiva, que es un dispositivo
detector de golpes que administra descargas eléctricas al detectarlos. La eficacia del tratamiento
se manifestó en el tiempo a través de los registros de los 5 años siguientes.
MÉTODOS EDUCATIVOS VIOLESNTOS MÁS FRECUENTES:
Los métodos punitivos (de castigo) más frecuentes utilizados por los padres son:
▪ Regaños / Reprimendas: Se caracterizan por un elevado volumen de voz, con tono imperativo y
de rechazo, comprende una restricción de la conducta del niño y puede acompañarse de una
amplísima gama de amenazas que, en general, nunca llegan a ser cumplidas y que se prometen
una y otra vez delante de situaciones similares. Por lo general,su efecto es muy a corto plazo y
el niño termina por no hacerle mucho caso.
- 76 -
▪ Pegar: Va desde darle un golpe en el culo con la mano hasta el uso de violencia extrema que
recuerda a las torturas. Sus escasos beneficios son de corta duración y en general el padre o la
madre que los utiliza acaba por arrepentirse de haberlo hecho, es frecuente que despierte
sentimientos de culpa y hacen que acto seguido, por lástima y culpabilidad, se le permita al niño
cualquier tipo de conducta.
CASTIGOS CON PROHIBICIONES:
Se pueden dividir en dos grupos:
▪ Castigo físico: El niño sentado, acostado, arrodillado, derecho de cara a la pared, entre otras
formas que pueden llegar a ser muy crueles. Sus efectos en general son más duraderos que los
métodos anteriores.
▪ Castigo psicológico: Consiste en una amplia gama de privaciones, prohibiciones y restricciones.
Van desde no dar (objetos, regalos, premios, permisos…) hasta sacar los que ya tenía. Suelen ser
efectos muy duraderos.
CRÍTICAS:
Consiste en regañar al niño enumerando sus defectos, puede frecuentemente implicar

comparaciones desventajas con otros niños y pueden ser de carácter privado (con el niño solo) o
públicas (ante otros miembros de la familia, otros niños o de cualquier persona). Puede tener efectos
muy duraderos en la vida del niño.
EFECTOS NEGATIVOS DE LOS MÉTODOS EDUCATIVOS VIOLENTOS EN EL CORTO, MEDIANO Y

LARGO PLAZO
Corto Plazo Mediano Plazo Largo Plazo
− Llanto asociado al − Inseguridad − Violencia
sufrimiento y el dolor físico − Miedos − Imposición irracional y por
o psicológico − Dificultades en las la fuerza
− Ira relaciones con los − Irracionalidad
− Sentimientos de culpa de coetáneos − Irritabilidad
sumisión forzada − Intranquilidad − Baja tolerancia a las
− Puede generarse − Desobediencia frustraciones
retraimiento − Actitudes retadoras − Trastornos en las
− Intranquilidad en el sueño − Agresividad con juguetes y relaciones sociales
y otras alteraciones del objetos y respuestas − Sobreexigencia, con los
mismo. inadecuadas a los adultos demás y consigo mismo
− Pueden presentar también − Afectaciones en la
dificultades para adaptarse autoestima
a nuevos ambientes − Inestabilidad emocional
− Pueden desarrollar
depresión
- 77 -
ÁMBITO LABORAL
PROPÓSITOS:
− Incrementar la Productividad y el Volumen de Ventas

− Disminuir el Absentismo Laboral y los Retrasos
− Disminuir las Pérdidas por Robo, Reducir los accidentes
− Mejorar la Relación entre los Jefes y Trabajadores
MOC: Manejo Organizacional del Comportamiento
Incorpora un uso frecuente de Recompensas y Retroalimentación de los trabajadores que actúan de

forma idónea.
Si se recompensa la productividad, aumenta la Motivación y aumenta el Rendimiento.
Se suele utilizar el Refuerzo Inmediato (que no es necesario que sea de tipo material sino que puede
constar de elogios verbales, informes favorables…)
ÁMBITO FAMILIAR
Terapia de pareja para promover interacciones recíprocas más positivas (refuerzos) entre los
cónyuges.
El Contrato de Contingencias: acuerdo escrito sobre las conductas requeridas para cada parte y los
beneficios de realizarlas. Elaboración conjunta. Aceptación de los términos y firma.
VENTAJAS:
− Compromiso explícito frente al terapeuta.

− Cada uno conoce los comportamientos deseados por el otro.
− Disminuye la posibilidad de olvido o distorsión retrospectiva de los acuerdos.
➢ INTERCAMBIOS DE REFUERZOS O INTERCAMBIOS CONDUCTUALES:
Habitualmente es necesaria también la incorporación de otros tipos de intervenciones (fuera del

reforzamiento instrumental como el entrenamiento en Resolución de Problemas, para
conseguir el efecto buscado.
➢ EDUCACIÓN DE LOS HIJOS:
Indicaciones de Wierson y Forehand (1994):
− Prestar atención a los hijos, destacar su comportamiento y ofrecer otros refuerzos cuando
se lleven bien, vigilando que esta conducta se mantenga.
− No hacer caso de rabietas (si se hizo caso antes puede que tarden un poco en desaparecer
y puede darse un punto exacerbación).
- 78 -
− No gritar ni pegar a los niños cuando se llevan mal y desobedecen. Hay que explicarles
qué han hecho mal y apartarles de cualquier cosa que pueda reforzarles durante un
tiempo.
➢ AUTOAPLICACIÓN DE LOS PRINCIPIOS DEL ACONDICIONAMIENTO OPERANTE:
Establecer los objetivos en términos ponderados y hacerlos públicos
Anotar cuántas veces y en qué condiciones obtenemos el propósito estipulado
Empezar por reforzar sistemáticamente el comportamiento deseado
Conforme el nuevo comportamiento se hace más habitual, ir reduciendo los incentivos y

animarnos mentalmente.
ÁMBITO CLÍNICO
Niños Autistas: promover Conductas Sociales, Comunicativas y Socialmente Adaptativas con el uso
de Refuerzos, y suprimir otras conductas mediante Tratamiento Aversivo (comportamiento
autolesivos, por ejemplo).
Búsquedas de Lovaas (1966, 1977) con el autismo: MOLDEO PROGRESIVO DE LA CONDUCTA VERBAL.
El Refuerzo inicial eran golosinas y, posteriormente, se empleaba el Elogio Verbal. Primero se

trabajaba la Conducta Verbal y después otras Habilidades Sociales y de Subsistencia como la higiene
y el cuidado personal, vestirse...
ANÁLISIS DE RESULTADOS Y CONCLUSIONES:
− No funcionaba con todo el mundo.

− Los mayores efectos se daban mediante programas intensivos con chicos jóvenes (calidad de
los programas y duración de los mismos)
− Funcionaban mejor si los programas eran aplicados en casa de los niños
Cuando se dejaba de aplicar el programa desaparecían rápidamente sus efectos. Se considera que
esta población requiere apoyo ambiental.
Limitaciones de la Modificación de Conducta, pero con personas autistas les capacita para llevar una
vida más aceptable.
ESQUIZOFRENIA:
Incidencia notable de los programas terapéuticos en el desarrollo de las Habilidades Sociales,

Comunicativas, Asertivas y de Higiene Personal en los pacientes (Bellach y Hersen, 1993).
Uso de la Economía de Fichas: variedad de reforzamiento consistente en un pago simbólico (a veces

los Refuerzos Sociales – Ej: aprobaciones verbales y elogios – no son suficientes y otros refuerzos
pueden no ser prácticos o posibles – como la comida –).
- 79 -
Los pacientes reciben, cuando se comportan adecuadamente, fichas de mayor o menor valor, que
funcionan como Refuerzos Secundarios que pueden canjearse por actividades recreativas y otros
refuerzos variados y potentes.
VENTAJAS DE LA ECONOMÍA DE FICHAS:
− Se pueden aplicar de forma más fácil, inmediata y consistente que los refuerzos naturales
convencionales frente a la emisión de conducta adecuada.
− Tienen mayor probabilidad de resultar atractivas al ser cambiadas por una gran variedad de
refuerzos.
− Facilita el manejo de refuerzos con grupos de personas.
Aplicación a numerosos contextos: hospitales, instituciones y clases para niños con retraso mental,
reformatorios para jóvenes con comportamiento antisocial, prisiones, colegios, cuarteles, fábricas y
centros de trabajo...
- 80 -

BLOQUE 1. Aprendizaje

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

BLOQUE 1. Aprendizaje

Cargado por

Copyright:

Formatos disponibles

BLOQUE 1

La causa de la evolución de la conducta es la necesidad de adaptación al medio y la supervivencia de

Las conductas más básicas son los reflejos y los instintos:

▪ Un reflejo es una respuesta automática ante un determinado estímulo. Esta conducta es

Los humanos tienen algunos instintos como el de supervivencia, el sexual, el de búsqueda de

RESPUESTA REFLEJA (“CONDUCTAS INVOLUNTARIAS”)

Algunos reflejos desaparecen con la edad, mientras que otros se mantienen

Conexión innata ente las neuronas SENSORIALES (aferentes) y las neuronas

− Porque muchas conductas son derivaciones, extensiones o variaciones de la conducta innata.

→ El aprendizaje es un cambio en la conducta, relativamente permanente, que se produce como

Aprendizaje ≠ cambio de conducta → comportamiento ante un semáforo en verde

Conducta = Reflejo del conocimiento adquirido

→ “… el aprendizaje tiene que caracterizarse como la formación de una representación de las

Estimulando al caracol con diferentes intensidades,

Kandel descubrió el rol de las sinapsis en dos tipos de aprendizajes: la HABITUACIÓN y la

▪ SENSIBILIZACIÓN: Es el comportamiento de aprendizaje en el que la respuesta se incrementa

La HABITUACIÓN es la tendencia a dejar de responder ante un estímulo que se presenta

La SENSIBILIZACIÓN es la tendencia a incrementar nuestras respuestas ante un estímulo que se

− Experimento de Swithers-Mulvey, Miller y Hall (1991) → Respuesta de consumo ante una

DISTINCIÓN ENTRE HABITUACIÓN Y…

▪ ADAPTACIÓN SENSORIAL: Se da cuando los órganos sensoriales pierden temporalmente la

▪ FATIGA: Se da cuando los músculos pierden la capacidad de responder debido a un ejercicio

Una característica de la habituación es que, a diferencia de la adaptación sensorial y la fatiga, es

− Tiene un carácter específico respecto al estímulo que se presenta repetidamente.

− La Sensibilización es un proceso de poca duración.

TEORÍAS DE LA HABITUACIÓN Y SENSIBILIZACIÓN:

1. TEORÍA DUAL DE LA HABITUACIÓN Y LA SENSIBILIZACIÓN. (Groves y Thompson, 1970)

Ej de las drogas: Proceso A → Estado placentero Proceso B → Reacciones adversas.

Primeras estimulaciones Después de muchas estimulaciones

Son todas aquellas teorías relacionadas con la Memoria.

El Registro Sensorial envía el Estímulo a un almacenamiento a Corto Plazo formado por la

"El Aprendizaje es un cambio inferido en el estado mental de un organismo, el cual es una

Dos tipos de aprendizaje asociativo: el condicionamiento clásico y el condicionamiento instrumental.

El Condicionamiento Clásico es uno de los mecanismos de aprendizaje más sencillos.

Mediante este proceso los organismos aprendemos a dar:

El Condicionamiento Clásico permite a los organismos predecir la secuencia de eventos que es

▪ Estímulo Incondicionado (EI): Es el acontecimiento o estímulo que provoca espontáneamente

Los EI tienen más fuerza biológica.

FORMAS DE LLAMAR A LOS ESTÍMULOS SEGÚN SUS CARACTERÍSTICAS:

▪ Estímulo NEUTRO: Es aquel estímulo que inicialmente NO provoca ninguna respuesta en el

▪ Estímulo RETROALIMENTADOR: Es aquel estímulo que ha sido provocado como consecuencia

Esquema de esta 2ª fase: EN + EI (que provoca la RI).

EJERCICIO 1: Describe el proceso de condicionamiento clásico responsable de lo que le pasa a Mireia

Algunos procedimientos experimentales empleados en el estudio del condicionamiento clásico:

➢ El condicionamiento del PARPADEO (años 60) – Gormezano y colaboradores –:

Fueron necesarios cientos de ensayos antes de que se produjera condicionamiento.

Dificultad alta para el condicionamiento.

➢ El SEGUIMIENTO DE SIGNOS o AUTOMOLDEAJE (Brown y Jenkins, 1968):

Se da cuando un EC señala de forma consistente la presentación de un EI.

Estímulos luminosos – tecla – (EC) y comida (EI).

Dificultad de adquisición del condicionamiento: Intermedia (en torno a 35 – 40 ensayos).

➢ La AVERSIÓN condicionada al gusto

Ejemplo: Aversión al pastel de chocolate si lo comes estando malo y te duele la barriga.

También llamado Respuesta Emocional Condicionada.

Estes y Skinner con ratas (1941).

Parálisis como expresión de miedo frente a determinados estímulos aversivos o amenazantes,

EC Sensorial (sonido, luz)

La aparición del miedo acondicionado se consigue con unos 3 – 5 ensayos.

PRESENTACIÓN TEMPORAL DE LOS ESTÍMULOS:

La mayor cantidad de aprendizaje se produce cuando el EC se presenta un poco antes de la

Algunos EC predicen la NO presentación del EI. Esta situación se llama ACONDICIONAMIENTO

Definición de CONTINGENCIA: es la relación entre dos probabilidades:

1. La probabilidad de que el EC se presente al mismo tiempo que el EI o P(EI / EC)