Está en la página 1de 43

Complemento a:

Pavlov y Skinner
Prof. Eddie Marrero
Historia de la Psicología
Depto. Ciencias Sociales
UPR,Mayaguez
Aprendizaje por
Condicionamiento Clásico (CC)
Introducción
Pavlov: estudia el proceso de salivación
como parte de la digestión
 Experimentos fisiológicos con mediciones
y control sistemático
 Resultados inesperados
 De problema a empresa investigativa y
formulación teórica: es posible aprender a
emitir respuestas reflejas ante estímulos
no naturales
Conceptos Básicos
Repuesta refleja natural o incondicionada - es una
respuesta automática, no aprendida (natural) que se
emite ante estímulos naturales específicos.

 Ej. comida en la boca – salivar

En este caso se dice que la respuesta de salivar es


natural ante el estímulo de la comida, a sea, que esa
respuesta no es aprendida.
Conceptos Básicos (cont.)
Según la teoría, lo que se puede es aprender a salivar ante
estímulos no naturales.

Ej. El sonido de una campana

Esto es posible pareando el estímulo no natural (o


condicionado) con el estímulo natural o incondicionado (Ej.
parear sonido de la campana y comida).
Con el tiempo, se saliva solo de oír la campana. En este caso
se dice que la respuesta de salivar es una respuesta
condicionada o sea, aprendida
Tipos de pareos entre EI - EC
Demorado – el EC se presenta ligeramente
antes que el EI; por un momento coinciden y
luego se deja de mostrar el EC.
Este es el tipo de pareo más efectivo porque
el EC se convierte en un anticipador del EI.

EC
EI=====>RI
Tipos de pareos entre EI - EC
Simultáneo - se presentan simultáneamente el EC y
el EI.
Este tipo de pareo es menos efectivo que el
demorado.
La fuerza del EC es menor porque queda opacado
por el EI.
Al ser simultáneos el EC no sirve para predecir el EI.

EC
EI ====> RI
Tipos de pareos entre EI - EC
de huella - En este se presenta el EC
primero y luego el EI.
Entre el primero y el segundo se deja pasar
algún tiempo, de manera que no coincidan.
Este tipo de pareamiento tiene muy poco
efecto

EC
EI =====> RI
Tipos de pareos entre EI - EC
Retrospectivo - La presentación del EC se
hace después del EI.
Con este tipo de pareo no se logra
aprendizaje alguno.

EI =======> RI
EC
Otros conceptos relacionados
Generalización - La respuesta condicionada se emite
ante estímulos que se parecen al EC (Ej. campana -
timbre)
Discriminación - La respuesta condicionada se emite
ante ciertos estímulos pero no ante otros (Ej. elipses
vs. Círculos y neurosis experimental)
Extinción - La respuesta condicionada desaparece
por razón de que cesa el pareamiento entre el EC y
el EI. Hay técnicas para lograr la extinción que se
aplican en psicoterapia
Otros conceptos relacionados
Recuperación espontánea - Luego de haberse
logrado la extinción es posible que la repuesta
condicionada reaparezca.
 Si por casualidad esa reaparición esta acompañada del EI la
extinción se hace posteriormente más difícil.
Condicionamiento de segundo orden: Es cuando un
EC sirve de base para una nueva respuesta
condicionada.
 Ej. El perro puede aprender a salivar ante el sonido de la
campana y hasta de solo ver la campana.
Aversión Gustativa
Es una situación de condicionamiento clásico
particular en la que un solo evento resulta suficiente
para producir la RC.
La respuesta es una de nauseas, mareos y vómitos
ante una comida que puede haber estado dañada o
que no es compatible con el organismo.
Luego, la reacción aversiva puede surgir de solo ver,
oler, probar o imaginar la comida en cuestión.
 Presentar ejemplos
Aprendizaje por Condicionamiento
Operante (CO)
Introducción
No todas nuestras conductas se basan en respuestas reflejas
como es la base del condicionamiento clásico.
De hecho, la mayor parte de nuestras conductas parecen ser
producto de nuestra voluntad (Ej. levantarnos para ir a la
universidad, tomar o no un taxi que nos lleve, copiar o no lo que
se dice en clase, por mencionar solo algunos ejemplos
sencillos).
La pregunta fundamental es: ¿cómo adquirimos y mantenemos
los diferentes patrones de conductas que llevamos a cabo día a
día?
Para los llamados “conductistas” adquirimos y preservamos
todas nuestras conductas como resultado de las consecuencias
ambientales de los mismos. Examinemos esta idea.
Trasfondo histórico:
Experimentos de Thorndike
Trasfondo histórico:
Experimentos de Thorndike
Explicar sus experimentos con gatos:
 el concepto de jaula – problema
 los comportamientos exitosos tienden a repetirse
 el gato pasa más tiempo cerca de la salida
 presiona en diferentes lugares con su pata a ver
que efecto tiene
 luego de varios días su conducta dentro de la
jaula se limita a aquellas acciones más efectivas
para salir de la misma
La ley del efecto
En un determinado ambiente, aquellas
conductas o respuestas que sean
seguidas de consecuencias
beneficiosas tenderán a repetirse,
mientras que aquellas respuestas que
no tengan consecuencias alguna o
consecuencias desfavorables tenderán
a no repetirse.
El conductismo según
expuesto por B.F. Skinner:
Conceptos fundamentales
Respuesta (Re)- Cualquier conducta que lleva a cabo un
organismo en un determinado ambiente ya sea por casualidad o
inducido a hacerlo
Refuerzo (Rf)- Cualquier evento ambiental que aumenta la
probabilidad de que una conducta se repita
Estimulo discriminativo (Ed)- Cualquier evento ambiental que
este dentro de las capacidades preceptúales de un organismo y
que le sirve de señal para emitir una conducta.
Respuesta operante (Ro) - Cualquier conducta cuya expresión
ha quedado bajo el control de un estimulo por causa de un
refuerzo
Conceptos fundamentales
De lo anterior se puede construir el siguiente
algoritmo:

Ed -------> Ro
Rf
el cual puede ser leída de la siguiente forma:
nuestras conductas se producen ante determinados
estímulos por causa de un refuerzo. O dicho de otra
forma, todos nuestros comportamientos consistentes
se expresan ante determinadas señales porque han
sido reforzados.
Conceptos fundamentales
Lo más importante del algoritmo señalado es que
permite: explicar, predecir y controlar. Por ejemplo,
permite decir que una determinada conducta se
expresa en un determinado momento por causa de
un refuerzo. Además, si quiero controlar la expresión
de la conducta debo presentar el estimulo
discriminativo; si esta presente el estimulo
discriminativo puedo predecir la aparición de la
respuesta. También, si tengo control del refuerzo
puedo controlar la conducta ya sea para que se
manifieste o para eliminarla (eliminando el refuerzo).
Parece complicado… y lo es!
Conceptos fundamentales
Al modelo de condicionamiento operante
también aplican los conceptos de:
 generalización
 discriminación
 extinción
 recuperación espontánea
Explicar estos conceptos con el ejemplo
clásico de la caja de Skinner
Programas de refuerzo
Se refiere a la manera en que se puede administrar el refuerzo
respecto a la conducta deseada.
Los programas de refuerzo se dividen a base de tiempo
(intervalo) o de cantidad (razón) y si son fijos o variables. La
combinación de cada categoría da como resultado cuatro
programas de refuerzo

Fijo Variable
Intervalo x x
Razon x x
Programas de refuerzo
Intervalo fijo - aquí el refuerzo se da luego de transcurrido un
tiempo fijo tras emitir la respuesta. Por ejemplo:
 2.5 horas de trabajo, 15 minutos de receso.
 Otro ejemplo: 2 horas de estudio, 2 horas de descanso

(incluyendo juego o TV).


Intervalo variable - El refuerzo se da tras espacios variables de
tiempo luego de manifestarse la conducta. Por ejemplo:
 15 minutos de estudio, media hora de juego; otro día, media
hora de estudio, media hora de descanso (la cantidad de
tiempo de estudio se refuerza de manera variable)
Programas de refuerzo
razón fija - El refuerzo se da luego de ocurrir la conducta un
número fijo de veces. Por ejemplo:
 12 piezas terminadas, se paga por las mismas.
 Otro ejemplo: aprendizaje asistido por computadoras: se

refuerza cada vez que el aprendiz conteste correctamente.


razón variable - El refuerzo se da luego de ocurrir la conducta
un número variable de veces. Por ejemplo:
 las tragamonedas: el refuerzo (ganar) se produce luego de

un numero variable de veces de repetirse la conducta


(jugar), a veces gana a los 3 intentos, luego a los diez, luego
a los 2, luego a los 15, luego a los 30, luego a los 2 y así
variablemente.
Programas de refuerzo
Cada programa de refuerzo resulta mas
practico para distintas circunstancias. Sin
embargo, en términos generales podemos
decir que los programas variables producen
conductas mas difíciles de extinguir ya que
suscitan el fenómeno "expectativa", esto es,
continuar repitiendo la conducta esperando
que “en algún momento” el refuerzo aparezca
Refuerzo Primario y Secundario

Refuerzo primario - Es aquel que adquiere su


capacidad de actuar como refuerzo por estar
directamente relacionado a la satisfacción de
las necesidades naturales del organismo (ej.
alimento, contacto, afecto)
Refuerzo secundario - Es aquel que adquiere
su capacidad de fungir como refuerzo porque
el organismo lo ha relacionado con la
adquisición de refuerzos primarios. Por
ejemplo: el dinero.
Refuerzo negativo
En términos básicos, se define el refuerzo negativo
como aquella situación en que la remoción de algo
aumenta la probabilidad de que ocurra una
conducta. Por ejemplo:
 una “campana” suena y no cesa hasta que se pone el cinturon
 digamos que un profesor establece que la evaluación de un
curso se hará basado en la calificación obtenida en 4
exámenes de los cuales 3 son parciales y uno es final
general. Luego, establece la siguiente condición: si al
momento del final su promedio en la clase es de sobre 90%,
pues esta eximido de tomar el final. Así, la potencial remoción
del final aumentara la probabilidad de que ocurra la conducta
de “estudiar intensamente”.
 Pague antes del 15 de abril y evite recargos y penalidades
Refuerzo negativo
El refuerzo negativo se diferencia del
refuerzo positivo en que en el refuerzo
positivo se da algo mientras que en el
negativo se quita algo. Sin embargo, en
ambos casos lo que se da o lo que se quita,
tiene como consecuencia aumentar la
probabilidad de que una determinada
conducta se repita.
Esto diferencia al refuerzo negativo del
castigo.
El castigo
En términos generales podemos decir que el castigo
reviste dos cualidades principales (que a su vez lo
diferencian del refuerzo positivo y del negativo).
 Primero - El castigo es en si un evento que resulta

desagradable (doloroso, lastimoso) a quien lo


recibe.
 Segundo - El propósito fundamental del castigo es

evitar que una conducta se repita; o sea que, el


castigo no incentiva conductas sino que quiere
reprimirlas.
El castigo
Dentro del condicionamiento operante (básicamente
skinneriano) no se recomienda el castigo como estrategia de
modificación de conducta porque el mismo puede tener efectos
secundarios no deseados; entre ellos:
 No siempre queda claro cual es la conducta que se quiere
reprimir.
 Como resultado de lo anterior puede suceder que se
repriman otras conductas que no son supuestamente las
deseadas (Ej. un padre castiga a su hijo porque interrumpe
sus conversaciones, como resultado el hijo se desarrolla
como una persona poco comunicativa).
 No necesariamente deja claro cuales son las conductas
alternas que se quieren promover (pues las mismas no se
están reforzando).
 Puede promover la conducta violenta y agresiva.

 La conducta se evita solo en presencia de quien castiga