Está en la página 1de 100

EL APRENDIZAJE

Facultad de Medicina/Escuela de Psicología.


Docente: Mgtr. Rina Isabel Santana Bazalar.
Definiciones
• El aprendizaje es el proceso por el cual la experiencia o
la práctica producen un cambio relativamente
permanente en la conducta o potencial conductual.
(Morris, 2005)

• Esta definición ciertamente abarca el aprendizaje


académico, pero cubre también muchas otras formas de
aprendizaje: aprender a apagar las luces cuando
salimos de un cuarto, aprender de qué manera hay que
introducir la llave en la cerradura de la puerta de
entrada, aprender a no caerse de los esquíes, aprender
a bailar.
Para Domjam (2010); el aprendizaje es un
cambio duradero en los mecanismos de la
conducta que involucra estímulos y/o
respuestas específicos y que es resultado
de la experiencia previa con esos estímulos
y respuestas o con otros similares.
Hay dos definiciones principales de aprendizaje que se
diferencian según el enfoque.

1. Versión Conductista: El aprendizaje es un cambio


relativamente permanente en la conducta que
resulta de la experiencia.

2. Versión Cognitivista: El aprendizaje es un


cambio relativamente permanente en la forma en
que el organismo representa su ambiente y
responde al mismo; este cambio es producto de la
experiencia.
• Nótese que el cambio es resultado de la experiencia, por
lo que el aprendizaje se opone a las conductas innatas.

• Las conductas innatas son aquellas que realizan los


individuos aún habiendo sido aislados desde su
nacimiento y no han tenido ocasión de aprenderlas. Las
conductas innatas son muy estereotipadas.

• Dentro de los comportamientos innatos se incluyen los


reflejos y los instintos.
Conducta provocada, habituación y
sensibilización.
LA CONDUCTA PROVOCADA.
• Buena parte de la conducta ocurre en respuesta a
estímulos, es decir, es provocada, por ejemplo: Una
partícula de comida en la boca produce salivación. La
exposición a una luz brillante ocasiona que las pupilas
se contraigan.
• Las respuestas provocadas varían desde los reflejos
simples hasta las secuencias más complejas de
conducta, las respuestas emocionales y la conducta
dirigida a metas.
LOS REFLEJOS.
• Son respuestas innatas, movimientos
involuntarios no aprendidos, automáticos y
universales que existen en todos los organismos
con sistema nervioso. Los reflejos se han
desarrollado para proporcionar un ajuste
comportamental rápido. (Ej. toser)
• Es la forma más básica de conducta
incondicionada.
• Aunque el reflejo es innato, no implica que no
puedan ser modulados por el aprendizaje.
Ejemplos de reflejos
• Ante un nivel bajo de temperatura se produce
una vasoconstricción de los capilares.
• Ante una elevada temperatura se produce una
vasodilatación.
• Ante un fuerte destello luminoso se produce un
cierre protector de los párpados.
• Los estornudos frente al polvo.
• Retirar la mano del fuego.
• Succión y prensión en bebés.
Reflejos
LOS INSTINTOS.
• Son patrones de conductas complejas, innatas y
características de los miembros de una especie (Ej.
instinto de cazar de los gatos)
• Es estereotipada, es decir se realiza en forma invariable
y en el mismo orden.
• Se desencadenan indeliberadamente.
• Continúan hasta su consumación.
• Son conductas de supervivencia para la especie.
• Es saciable, difícil de provocar tras estimulaciones
repetidas.
Ejemplos de instintos
• La construcción de nidos o las migraciones que
realizan las aves, que no son explicables como
conductas reflejas, y que únicamente se pueden
considerar como instintos o disposiciones
innatas que poseen los seres vivos y que les
llevan a realizar conductas muy elaboradas
características de la especie, las cuales tienen
como finalidad tanto la conservación de la
misma como la del individuo.
APRENDIZAJE PRE ASOCIATIVO

• Es la primera y primitiva forma de adaptación al


ambiente conseguida a través de la modificación de las
respuestas naturales.
• La conducta refleja nunca se repite de la misma manera,
la exposición repetida al estímulo elicitador del reflejo
lleva a que el sujeto bien disminuya o bien aumente su
respuesta ante el estímulo.
• Estos dos fenómenos básicos de aprendizaje antes
mencionados se denominan habituación y
sensibilización, respectivamente.
• No son conductas innatas ni aprendizajes asociativos
porque no hay una asociación de sucesos, son fruto de
la experiencia del individuo en su entorno.
Habituación
• Es la forma más simple de aprendizaje.
Se produce cuando una respuesta refleja desaparece
temporalmente como resultado de haber sido
provocada repetidamente por el mismo estímulo.

• Por ejemplo: Batimos palmas fuertemente cerca de un


bebé. El bebé sufre un fuerte sobresalto. Continuamos
batiendo palmas a intervalos de 15 segundos. El
sobresalto decrecerá progresivamente. El bebé se
habitúa al estímulo hasta que deja de emitir respuesta
refleja o de adaptación.
Ejemplos de Habituación
• Las personas se sobresaltan con los
primeros fuegos artificiales, pero conforme
avanza el tiempo se van acostumbrando
progresivamente al ruido.
• Acostumbrarse a vivir cerca de un
aeropuerto, cuando los primeros días es
una tortura (por el ruido).
Sensibilización
• Es un incremento más o menos permanente que
experimenta una respuesta innata por efecto de su
estimulación repetida.

• Aprendizaje pre-asociativo de carácter positivo, puesto


que incrementa la respuesta como consecuencia de la
reiteración del estímulo.
Ejemplos sensibilización
• La primera vez en una ópera, no se distingue el sonido
de los clarinetes, después de escuchase muchas veces,
se puede diferenciar ese sonido claramente.

• Un vigilante que distingue los ruidos comunes de la


calle, de los que podrían indicarle el forcejeo de una
cerradura.

• Un perfume excesivamente intenso, tanto que llega a


ser molesto, lo percibiremos con más intensidad y nos
resultará cada vez más difícilmente soportable.
Características:
Habituación Sensibilización
- Es específica del estímulo que se - No es específica del estímulo que
repite. se repite. Sus efectos también se
- Se atenúa con el paso del tiempo observan en otros estímulos
sin estimulación (recuperación diferentes al presentado.
espontánea). - A mayor intensidad del estímulo,
- A mayor frecuencia de repetición mayor sensibilización.
del estímulo, mayor habituación.
- A menor intensidad del estímulo,
mayor habituación.
APRENDIZAJE ASOCIATIVO
Ivan Petrovich Pavlov
• Estudió el proceso de salivación como parte de la
digestión.

• Realizó experimentos fisiológicos con mediciones y


control sistemático.

• Obtuvo resultados inesperados.

• De problema a empresa investigativa y formulación


teórica: es posible aprender a emitir respuestas
reflejas ante estímulos no naturales.
Condicionamiento clásico: Elementos.

Estímulo Incondicionado. Estímulo bilógicamente significativo


EI para el sujeto (S), elicita la respuesta automáticamente. (comida)
E
Respuesta Incondicionada. Se elicita directamente por el EI, sin
l RI necesidad de aprendizaje previo. (salivación)
e
m
Estímulo Neutro. Es aquel que no suscita ninguna respuesta en el
e EN organismo. (sonido del metrónomo)
n
t
o Estímulo Condicionado. Es aquel que inicialmente es neutro y que
s EC apareado con el incondicionado producirá la respuesta
condicionada. (sonido del metrónomo)

RC Respuesta Condicionada. Es un componente de la respuesta


incondicionada que se suscita en presencia del EC. (salivación)
Condicionamiento clásico: Proceso
ANTES DEL CONDICIONAMIENTO

El alimento (estímulo
incondicionado) produce
una respuesta
incondicionada, no
aprendida (salivación).

La campana (estímulo
neutro) no tiene ningún
efecto sobre la salivación,
no produce la respuesta
de salivación.
Fotos del perro tomadas de Myers: Psicología (3ª edi.)
Condicionamiento clásico
DURANTE EL CONDICIONAMIENTO

Inmediatamente antes de presentar el estímulo


incondicionado (el alimento) el experimentador presenta
el estímulo neutro (el sonido de la campana). El estímulo
incondicionado sigue produciendo la respuesta
incondicionada (salivación).

Foto del perro tomadas de Myers: Psicología (3ª edi.)


DESPUÉS DEL CONDICIONAMIENTO

El sonido de la campana es capaz de generar la


respuesta de salivación, por lo que deja de ser un
estímulo neutro y pasa a ser un estímulo condicionado
capaz de generar una respuesta condicionada o
aprendida (salivación ante el sonido de la campana).

Foto del perro tomadas de Myers: Psicología (3ª edi.)


Ejercicios: Identificar los elementos y el
proceso del condicionamiento clásico.
• Perro, ladrido, miedo; luego miedo a los perros.
EI = Ladrido. 1. Antes: EI RI
RI = Miedo. EN X
EN = Perro. 2. Durante: EI EN RI
EC = Perro. N° veces

RC = Miedo 3. Después: EC RC
• Depósito de libros, reacción alérgica, hongos,
acumulación de libros.
• Vergüenza al hablar, reprimenda de los padres,
temor de hablar en público.

• Jefe, tensión, trabajo, tensión, lunes


por la mañana.

• Inyección, dolor, miedo, enfermera, hospital,


alcohol.
Métodos o procedimientos de
condicionamiento
Condicionamiento Condicionamiento Condicionamiento Condicionamiento
Simultáneo Diferido demorado Retroactivo Huella o Vestigial
(los dos a la vez) (antes el E.N) (antes E.I ) (Intervalo entre 2)

• EN EN EN EN

• EI EI EI EI

El método más eficaz es el Condicionamiento Diferido y el


más ineficaz es el Condicionamiento Retroactivo.
Condicionamiento emocional.
El experimento con el “pequeño Albert”.
• Para poner a prueba su hipótesis de que las emociones podían
aprenderse por la asociación condicionada, John Broadus Watson
utilizó a un niño de 11 meses llamado Albert como sujeto
experimental.

• Albert fue llevado al laboratorio donde se le presentaba una rata


blanca. Cuando el pequeño se acercaba para tocarla, Watson
golpeaba una barra metálica con un martillo. Como consecuencia
del fuerte golpe, el bebé se alteraba y fruto del miedo se ponía a
llorar. Watson repitió este proceso media docena de veces, y
observó que, tras distintos ensayos, el pequeño Albert se asustaba
simplemente por el hecho de ver la rata blanca. Albert había
aprendido que cada vez que la rata aparecía, el martillo golpearía la
tabla metálica. Es decir, que anticipaba el fuerte golpe.
Condicionamiento de aversión al sabor (García y
Koelling, 1967). Ratas, comidas y sabores

Adquisición:
- EC (sabor de la comida)
- EI aversivo (inyección de cloruro de litio o
exposición a rayos X)
- RI (malestar digestivo y aversión al sabor)
Resultados: EC – RC de aversión al sabor (come menos)
a. Aparece con muy poco entrenamiento (a veces 1 solo
ensayo es suficiente): Medio de defensa natural ante
alimentos peligrosos. Más vale envenenarse una sola vez.
b. Intervalo largo (varias horas) entre EC y EI: Para que un
alimento en mal estado te haga daño, primero tiene que
digerirse.
c. Sólo funciona con cierto tipo de EC (sabores, a veces
olores): Pertinencia EC-EI.
Condicionamiento instrumental
No todas nuestras conductas se basan en respuestas
reflejas como es la base del condicionamiento clásico.
De hecho, la mayor parte de nuestras conductas parecen
ser producto de nuestra voluntad (Ej. levantarnos para ir a
la universidad, tomar o no un taxi que nos lleve, copiar o no
lo que se dice en clase, por mencionar solo algunos
ejemplos sencillos).
La pregunta fundamental es: ¿cómo adquirimos y
mantenemos los diferentes patrones de conductas que
llevamos a cabo día a día?
Adquirimos y preservamos todas nuestras conductas como
resultado de las consecuencias ambientales de los mismos.
Cuentan que Tales de Mileto, siendo mercader de sal, la distribuía a
lomos de una reata de mulas. En una ocasión una de las mulas
resbaló y se cayó al cruzar un río y, como consecuencia, buena parte
de la sal se derritió, aliviando sustancialmente su carga. Al atravesar
el siguiente río la mula se sumergió “adrede” y continuó haciéndolo
cada vez que cruzaba un paso de agua. Así las cosas, Tales no tardó en
idear una treta para cortar de raíz la picaresca de la mula: llenó sus
sacos con esponjas. Sumergirse a partir de ese momento le resultaba
contraproducente ya que no sólo no aliviaba el peso sino que lo
aumentaba. La mula dejó de sumergirse para no aumentar su carga
como antes había aprendido a sumergirse para reducirla.
Adaptado de Froufe (2004), págs.: 222-223.
• La mula aprendió incidentalmente que el comportamiento de
sumergirse en el agua aliviaba el sufrimiento que le producía la carga
• La mula aprendió después que ese comportamiento tenía
consecuencias indeseables

El comportamiento de sumergirse se convirtió en “instrumento” para


evitar el sufrimiento del peso
Aprendió el control de lo que le sucedía
La madre que premia con besos y abrazos a su hija por recoger los
juguetes que ha utilizado durante la tarde, o que la castiga
apagando la televisión porque grita y patalea, son ejemplos en los
que la madre maneja las consecuencias de la conducta de su hija
con la pretensión de que la niña mantenga y repita el
comportamiento de recoger los juguetes y no grite ni patalee
cuando está viendo la televisión.
• La niña aprenderá que el comportamiento de recoger los juguetes
después de utilizarlos tiene como consecuencia las caricias de la
madre y que, por ello, se acostumbrará a hacerlo.
• La niña también aprenderá que gritar y patalear tiene la
consecuencia de quedarse sin ver la televisión y, por ello, dejará de
hacerlo.

El comportamiento de la niña es “instrumento” para conseguir los


besos y los abrazos de su madre y para producir consecuencias
desagradables.
Experimentos de Edward LeeThorndike
Experimento con gatos:

• El concepto de cajas problema.


• El gato realizaba respuestas al azar hasta que por
casualidad encontraba la respuesta adecuada y
conseguía salir de la caja.
• La latencia (tiempo necesario para salir de la caja)
disminuía a medida que se repetían los ensayos en una
caja concreta.
• Luego de varios días su conducta dentro de la caja se
limita a aquellas acciones más efectivas para salir de la
misma.
Para Thorndike, el aprendizaje se basa en
una serie de conexiones entre un estímulo
y una respuesta. Esta conexión se
mantiene y se hace más fuerte a medida
que tiene beneficios para el organismo.
Esta idea fue la base para lo que después
Skinner denominó condicionamiento
instrumental.
Thorndike –Tres leyes
fundamentales
• Ley de preparación.
• Ley de efecto.
• Ley del ejercicio.
Ley de Preparación
• Afirma que la preparación o disposición del
sujeto contribuye al aprendizaje.
• Esto ocurre debido a que cuando un ser vivo
está preparado para hacer algo, le satisface el
hacerlo. En otras palabras, que las propias
expectativas del sujeto constituyen el refuerzo
intrínseco de toda acción.
• Hay ciertas conexiones que están más
predeterminadas biológicamente, por tanto es
más fácil que se den unas que otras.
La Ley del Efecto
• En un determinado ambiente, aquellas
conductas o respuestas que sean
seguidas de consecuencias
beneficiosas tenderán a repetirse,
mientras que aquellas respuestas que
no tengan consecuencia alguna o
consecuencias desfavorables tenderán
a no repetirse.
• Si la conexión entre estímulo y respuesta
es recompensada esta conexión se hace
más fuerte y tiene más probabilidades de
repetirse en el futuro; en cambio al ser
castigada se debilita.
Ley del Ejercicio
• La repetición de una conexión entre el
estímulo y la respuesta afianza dicha
conexión, y por tanto, el aprendizaje.
Condicionamiento Operante

• Es el condicionamiento que explica e


inculca las conductas complejas y
voluntarias
• Basándose en la ley del efecto (la
conducta recompensada probablemente
se repetirá) creó una tecnología de la
conducta
CONDICIONAMIENTO OPERANTE

• Proceso a través del cual se aprende una


conducta a través de sus consecuencias por
reforzadores. Se aparea R’con E’ reforzador.
“The Behavior of Organisms” (1938)
• “Ley del Efecto” Thorndike (1874) una respuesta
se hace más o menos probable dependiendo de
sus consecuencias.
• Proceso de ejercer control sobre la conducta de
un organismo en un ambiente por medio de la
aplicación de un refuerzo. Ardila (1970)
Condicionamiento operante

B.F. Skinner

La caja de Skinner
Fotos tomadas de Myers: Psicología (3ª edi.)
Elementos
• La definición técnica del condicionamiento
operante es que la conducta está en función de
los eventos ambientales (ya sean antecedentes
o consecuentes), y de esta forma la determinan.
• A esta relación se le llama triple contingencia, y
la comprenden los tres siguientes componentes:
– Eventos antecedentes (estímulos discriminativos)
– Conducta (respuesta)
– Eventos consecuentes (refuerzos)
• En la vida cotidiana lo hacemos constantemente, pero a
menudo sin intención
• A veces incluso reforzamos la conducta que deseamos
eliminar:

Luisito: ¿Podrías atarme los zapatos?


Padre: (continua leyendo el periódico)
Luisito: Papá, necesito que me ates los zapatos
Padre: Ahhh, si… un momento
Luisito: ¡PAPAAAA! ¡ATAME LOS ZAPATOS!
Padre: ¿Cuántas veces te he dicho que no grites?
Bien, ¿qué zapato quieres que ate?
Siempre que Luisito tiene una rabieta su padre
cede en bien de la paz y de la tranquilidad.

• La rabieta de Luisito se ve consolidada por el


reforzador positivo (su padre cede y consigue
lo que quiere)

• El comportamiento del padre (ceder) se ve


consolidado por el reforzador negativo (Luisito
dejó de llorar y patalear)
Elementos del condicionamiento
operante
Estímulo discriminativo (Ed). Cualquier evento ambiental
que esté dentro de las capacidades preceptuales de un
organismo y que le sirve de señal para emitir una
conducta.

Respuesta (Re). Cualquier conducta que lleva a cabo un


organismo en un determinado ambiente ya sea por
casualidad o inducido a hacerlo.

Refuerzo (Rf). Cualquier evento ambiental que aumenta la


probabilidad de que una conducta se repita.
Ed Re Rf

SITUACIÓN COGNITIVA EVENTOS


INTERNA O EMOCIONAL INTERNOS
EXTERNA FISIOLÓGICA EXTERNOS
MOTORA
Procedimientos operantes
Principio Característica Efectos sobre la Conducta

Reforzamiento Presentación o retirada de un acontecimiento


después de una respuesta. Aumenta la frecuencia de la respuesta.

Castigo Presentación o retirada de un acontecimiento


después de una respuesta. Disminuye la frecuencia de la respuesta.

Extinción Cese de la presentación de un acontecimiento


reforzarte después de una respuesta Disminuye la frecuencia de la respuesta
anteriormente reforzada.
Reforzador: Tipos.
• Reforzador primario: Es aquel que adquiere su
capacidad de actuar como refuerzo por estar
directamente relacionado a la satisfacción de
las necesidades naturales del organismo (ej.
alimento, contacto, afecto)
• Reforzador secundario: Es aquel que adquiere
su capacidad de fungir como refuerzo porque
el organismo lo ha relacionado con la
adquisición de refuerzos primarios.
Por ejemplo: el dinero.
Reforzamiento
• El principio del reforzamiento se refiere a
un incremento en la frecuencia de una
respuesta cuando a esta respuesta le
siguen ciertas consecuencias. La
consecuencia que procede a la conducta
debe ser contingente a la misma. Un
evento contingente que incrementa la
frecuencia de una conducta se conoce
como reforzador (Kazdin,1996).
Reforzamiento positivo
• Evento que presentado inmediatamente después de la
emisión de una conducta aumenta la probabilidad de
que esta se presente.
• Un ejemplo típico es el caso de una rata que pulsa una
palanca y consigue comida.
Un alumno al finalizar su disertación de psicología,
obtiene las felicitaciones del profesor y los aplausos
objetivos de sus compañeros. Aquí las felicitaciones y
aplausos son refuerzos positivos, ya al resultar
gratificante para el alumno este refuerzo, su respuesta
será estudiar con más dedicación aun, para el próximo
trabajo.
• Si María le dice a Pedro que lo quiere mucho más
después de haberle regalado chocolates, la
consecuencia de la conducta de Pedro, será tan
gratificante para él, que su conducta se verá reforzada a
que aumente o se repita en el futuro.
Reforzamiento del comportamiento
Condicionamiento
operante
(instrumental)

Reforzamiento positivo = Recompensa que fortalece la conducta


apropiada .

Al pagar un precio alto en


un hotel obtengo un servicio
Premium de confort, y mucho lujo

Se usa para provocar la respuesta deseada


Reforzamiento negativo
En términos básicos, se define el reforzamiento negativo como aquella
situación en que la remoción de algo aumenta la probabilidad de que ocurra
una conducta. Por ejemplo:

– Una “campana” suena y no cesa hasta que se pone el cinturón


– Digamos que un profesor establece que la evaluación de un curso se
hará basado en la calificación obtenida en 4 exámenes de los cuales 3
son parciales y uno es final general. Luego, establece la siguiente
condición: si al momento del final su promedio en la clase es de sobre
90%, pues esta eximido de tomar el final. Así, la potencial remoción del
final aumentara la probabilidad de que ocurra la conducta de “estudiar
intensamente”.
– Pague antes del 15 de abril y evite recargos y penalidades.
– Una persona al presentar fuerte dolores de cabeza, toma algún
analgésico que haga desaparecer esa molestia. Acá, el estimulo (dolor
de cabeza) que antecede a la conducta, es eliminado tomando un
analgésico.
Reforzamiento del comportamiento
Condicionamiento
operante
(instrumental)

Reforzamiento negativo = Fortalece las respuestas de modo que se


aprende la conducta apropiada (evitar resultados negativos)*

Las pastas de dientes y enjuagues


bucales EVITAN el mal aliento. Por
lo tanto al tener higiene bucal se
evita el mal aliento

* Se usa para provocar la respuesta deseada


Castigo
Estímulos o consecuencia desagradables o
dolorosos que, inmediatamente después de una
conducta, hace que disminuya la probabilidad de que
la conducta vuelva a repetir. Existen dos tipos de
castigo:
Castigo Positivo: Consiste en la aparición de un
evento displacentero o doloroso. Ejemplo: El profesor
le dice al curso que copien 30 veces la frase, golpes,
retos, etc.
Castigo Negativo: Consiste en la desaparición de
un evento “bueno” o placentero. Ejemplo: Una
profesora deja a la clase sin recreo.
En términos generales podemos decir que el castigo
reviste dos cualidades principales (que a su vez lo
diferencian del refuerzo positivo y del negativo).
• Primero - El castigo es en si un evento que resulta
desagradable (doloroso, lastimoso) a quien lo
recibe.
• Segundo - El propósito fundamental del castigo es
evitar que una conducta se repita; o sea que, el
castigo no incentiva conductas sino que quiere
reprimirlas.
Reforzamiento del comportamiento
Condicionamiento
operante
(instrumental)

Castigo = El propósito es desalentar un comportamiento determinado

Cuando los consumidores no pagan


sus tarjetas a tiempo, se les castiga
cobrándoles intereses.
Extinción
• Proceso mediante el cual una conducta deja
de emitirse al descontinuar el reforzamiento
que la mantenía. Una conducta o respuesta
se acaba por que deja de recibir lo que la
hace existir. Ejemplo:
– En una clase se comprobó que la mala conducta
aumentó cuando los maestros prestaron atención a
ella y disminuyó por debajo del nivel usual cuando
la pasaron por alto y prestaron su atención a los
niños que no se estaban portando mal
TIPOS DE CONDICIONAMIENTO INSTRUMENTAL

NOMBRE DEL CONTINGENCIA


PROCEDIMIENTO RESPUESTA-CONSECUENCIA RESULTADO

Reforzamiento positivo Positiva: la respuesta produce Reforzamiento o


un estímulo apetitivo incremento en la tasa de
respuesta

Castigo (castigo positivo) Positiva: la respuesta produce Supresión o


un estímulo aversivo disminución en la tasa de
respuesta

Reforzamiento negativo Negativa: la respuesta elimina Reforzamiento o


(escape o evitación) o previene la ocurrencia de un incremento en la tasa de
estímulo respuesta
Elementos básicos del
condicionamiento instrumental
• Adquisición: A través de la técnica de
moldeamiento por aproximaciones sucesivas
a la conducta objetivo.

El primer paso consiste en estudiar el repertorio


conductual del S, y definir claramente la conducta que
queremos que realice, se debe partir de las conductas
que ya tiene en su repertorio y guiarlo poco a poco
hasta la conducta objetivo.
Programas de reforzamiento
Se refiere a la manera en que se puede administrar el
refuerzo respecto a la conducta deseada.

Los programas de refuerzo se dividen en base al tiempo


(intervalo) o la cantidad (razón), y si son fijos o variables.

La combinación de cada categoría da como resultado


cuatro programas de refuerzo

Fijo Variable
Intervalo x x
Razón x x
Cada programa de reforzamiento resulta mas
práctico para distintas circunstancias. Sin
embargo, en términos generales podemos
decir que los programas variables producen
conductas mas difíciles de extinguir ya que
suscitan el fenómeno "expectativa", esto es,
continuar repitiendo la conducta esperando
que “en algún momento” el refuerzo aparezca
Programas de reforzamiento
Condicionamiento
operante
(instrumental)

1. Reforzamiento total o continuo

Cada vez que se compra algo con la


tarjeta “American Express” Delta Sky
Miles, el cliente acumula millas para
volar con Delta que a su vez es
miembro de SkyTeam.
Razón fija - El refuerzo se da luego de ocurrir la conducta
un número fijo de veces. Por ejemplo:
12 piezas terminadas, se paga por las mismas.
Otro ejemplo: aprendizaje asistido por computadoras: se
refuerza cada vez que el aprendiz conteste
correctamente. Felicitaciones

Razón variable - El refuerzo se da luego de ocurrir la


conducta un número variable de veces. Por ejemplo:
los tragamonedas: el refuerzo (ganar) se produce luego
de un numero variable de veces de repetirse la conducta
(jugar), a veces gana a los 3 intentos, luego a los diez,
luego a los 2, luego a los 15, luego a los 30, luego a los 2
y así variablemente.
Programas de reforzamiento
Condicionamiento
operante
(instrumental)

2. Reforzamiento razón fija

Provee el reforzamiento cada


“enésima” vez que el producto o el
servicio es comprado

Ej. Con el servicio de 20,000,


40,000, 60,000 y 80,000 Kms. en la
agencia donde compraste el auto, la
agencia te obsequia X regalo
Programas de reforzamiento
Condicionamiento
operante
(instrumental)

3. Reforzamiento razón variable

Ej. En las máquinas tragamonedas


en los casinos, la gente deposita
dinero con la esperanza de ganar el
premio grande
Intervalo fijo - Aquí el refuerzo se da luego de transcurrido
un tiempo fijo tras emitir la respuesta. Por ejemplo:
2.5 horas de trabajo, 15 minutos de receso. Otro ejemplo:
2 horas de estudio, 2 horas de descanso (incluyendo juego
o TV). Ejm. Pago a destajo.

Intervalo variable - El refuerzo se da tras espacios


variables de tiempo luego de manifestarse la conducta. Por
ejemplo:15 minutos de estudio, media hora de juego; otro
día, media hora de estudio, media hora de descanso (la
cantidad de tiempo de estudio se refuerza de manera
variable). Ejm. Comisiones.
Diferencia entre Condicionamiento
Clásico y Condicionamiento Operante

CONDICIONAMIENTO CLÁSICO CONDICIONAMIENTO OPERANTE

Un estímulo neurológico se convierte en un El aprendiz opera en el entorno y recibe


reflejo asociado. Ejemplo: el sonido de la una recompensa por determinada
campana se asocia con la salivación. conducta. Ejemplo: el individuo acciona una
palanca y recibe comida.
Es el reflejo. Una simple conducta innata, No es un reflejo, el sujeto debe realizar una
en la que produce una respuesta inevitable actividad para obtener algo a cambio.
ante una modificación de la situación
ambiental.
Es una combinación de dos factores, La conducta es externa, ya que tiene un
estímulo y respuesta. La conducta es efecto sobre el mundo exterior al individuo.
interna e innata. La relación de la conducta tiene un efecto
que aumenta la probabilidad de que en
condiciones similares vuelva a aparecer la
misma.
A pesar de que el condicionamiento operante
representa una evolución respecto al
condicionamiento clásico, algunos plantean que
limitar la explicación del aprendizaje al ambiente y
a las conductas, resulta limitado.
Algunos investigadores, en diferentes momentos,
propusieron categorías y procedimientos sobre el
aprendizaje que requerían ir más allá del ambiente
y del comportamiento manifiesto. Específicamente,
requerían ir al ámbito de lo mental (o cognoscitivo)
para poder explicar determinados fenómenos.
En esta sección exploraremos algunos de los
pioneros en esa dirección y algunos de sus
señalamientos más importantes.
Ratas reflexivas y aprendizaje en
laberintos
Tolman estudió por algún tiempo el aprendizaje de las ratas en
laberintos. Pronto se convenció de que las explicaciones sobre el
aprendizaje en laberintos que destacaban la impresión mecánica
en o fuera de las conexiones entre estímulos y respuestas no
describían adecuadamente las conductas que él observaba.

Parecía haber algo más en la conducta de sus ratas que el mero


hecho de que los estímulos, las recompensas y los castigos las
hicieran andar de un lado a otro. Lejos de comportarse en forma
mecánica e irreflexiva, Tolman observaba que las ratas se
conducían con inteligencia y propósito.

Tolman consideraba que las ratas habían aprendido el esquema


general o distribución del laberinto, a lo que llamó un mapa
cognitivo. Se propuso desarrollar un nuevo conductismo, basado
en observaciones objetivas del comportamiento (método), pero
que incluyera el análisis de propósitos y la cognición (teoría).
• Tolman resumió sus planteamientos en una serie de
trabajos publicados en la década de los años 20 del siglo
pasado, y luego los resume en su libro clásico: Purposive
behavior in animal and men. En realidad la mayor parte
del trabajo había sido hecho con ratas y, de hecho, Tolman
dedica el libro a MNA (Mus norvegicus albinus o la rata
albina noruega).
• El texto es un fuerte ataque a los sistemas psicológicos
mentalistas y un espaldarazo al modelo conductista.
• La psicología, según Tolman, debe ser una ciencia objetiva
de la conducta y centrarse en conductas molares
(globales), por ejemplo: una rata que recorre un laberinto, un gato
que sale de una caja problema, un hombre que
regresa a casa para cenar. Todos son actos molares, son
intencionales y están orientados a una meta, son por lo tanto, actos
cognitivos.
• La intencionalidad, Tolman la demuestra en una serie de
experimentos en los que varía sistemáticamente la
recompensa tras una tarea, por ejemplo recorrer el
laberinto.
• Cuando se acostumbraba la rata a un refuerzo y este
era cambiado por uno mejor o peor, se observaban
cambios dramáticos en la conducta posterior de recorrer
el laberinto.
• Si el refuerzo mejoraba, la conducta también mejoraba.
Si el refuerzo era peor, así también variaba la conducta.
Según Tolman esto evidenciaba que las ratas habían
adquirido expectativas específicas de los resultados de
sus conductas.
Aprendizaje latente de Tolman

Aprendizaje que se adquiere de manera no


intencionada. Permanece oculto o latente y aflora
cuando se necesita.
Se produce cuando la conducta objeto del aprendizaje
se adquiere, la conducta se aprende (permanece oculta
o latente) pero no se utiliza porque no hay “necesidad” o
estímulo (motivación) para hacerlo.
Tolman hace otra serie de experimentos dirigidos a
demostrar la importancia del refuerzo en el aprendizaje.
A tales fines hace recorrer diferentes grupos de ratas a
través de un laberinto variando entre grupos cuándo
iniciar la administración de refuerzos.
Aprendizaje latente
El grupo control recibió refuerzo desde el primer día tan pronto
arribaban a la meta. El segundo grupo recorrió el laberinto por 6 días
sin recibir refuerzo. Este grupo recibió refuerzo por vez primera el
séptimo día. El otro grupo fue una variante del anterior, pero recibió
refuerzo mas prontamente, al tercer día. Tanto en el grupo 2 como en
el 3 se observó un cambio dramático al día siguiente del día reforzado.
En ambos grupos el número de errores cometidos en alcanzar la meta
era sustancialmente mayor que los del grupo control durante el periodo
de no refuerzo. Sin embargo, tan pronto fueron reforzadas, al día
siguiente el número de errores disminuyó sustancialmente, igualando
sus ejecutorias con las del grupo control.

Según Tolman, las ratas habían aprendido aun sin ser reforzadas.
Habían logrado construir un mapa cognitivo de su ambiente, el cual
pusieron en rigor tan pronto fueron reforzadas. El refuerzo no había
sido indispensable para que ocurriera el aprendizaje, pero sí para que
se manifestara el mismo. Tolman llamó a este aprendizaje no
manifiesto aprendizaje latente.
Aprendizaje por insight
• En otra serie de experimentos Tolman probó el efecto de la
representación mental, (mapa) en la toma de decisiones por
visualización interna de la resolución de un problema (insight). Esta
serie de experimentos tienen que ver con el contacto de Tolman con
la escuela de la Gestalt.
• El experimento modelo consistía de un laberinto con tres rutas de
distintas longitudes, pero con un mismo punto de llegada. Además,
el laberinto era elevado, sin flancos, de forma que la rata podía ver
todo el laberinto desde cualquier punto. Primero se permitió a las
ratas que exploraran el laberinto sin ofrecérsele refuerzo por el
recorrido. Luego se ofreció refuerzo por llegar a la meta.
En las siguientes pruebas se observó que la rata al ser puesta en el
punto inicial y soltada, tomaba de inmediato la ruta mas corta para
llegar a la meta. Según Tolman esto demostraba la toma de
decisiones basada en una representación interna y obedeciendo
además a lo que él llamó la ley del menor esfuerzo (algo similar a
las leyes de la Gestalt)
• Luego de varias repeticiones se procedía a bloquear el camino mas
corto que era el que utilizaban las ratas. Al tener otras dos opciones,
las ratas optaron, de entre esas dos opciones por la mas corta de
las dos. Según Tolman, las ratas habían hecho un mapa mental de
todo el laberinto.
Laberinto de 3 rutas

Demostró que lo que aprende una rata no


es una respuesta sino un lugar.
Aprendizaje de lugar o de
respuesta
En una versión de sus
experimentos utilizó un
laberinto sencillo en forma de
Cruz.
A las ratas se les permitió
explorar el laberinto sin darles
refuerzo alguno.
Luego comenzó el proceso de
refuerzo. Las ratas eran
soltadas en el punto A y se les
reforzaba en el punto B.
Luego de varios intentos, las
ratas aprendieron la relación y
la ejecutaban rápidamente
La pregunta que Tolman se
hacía era si las ratas habían
aprendido simplemente a
voltear a la derecha o habían
aprendido el lugar basado en
el mapa.
Para probar esta idea puso a
las ratas a comenzar en el
punto C. Al llegar al punto de
decisión la mayoría de las
ratas volteaban hacia B (a la
izquierda, en vez de a la
derecha) Según Tolman esto
evidenciaba que las ratas
habían aprendido un lugar
mas que una respuesta.
En otra versión, se adiestran
dos grupos a recorrer un
laberinto en forma de cruz.
Luego de explorar el
laberinto, las ratas de cada
grupo comienzan
aleatoriamente desde los
puntos S1 o S2.
La diferencia entre ambos
grupos consiste en que el
grupo de la condición de
aprendizaje de respuestas
siempre encontrarían
alimento al voltear a la
derecha, mientras que las
del grupo de lugar siempre
encontraron el alimento en
el mismo sitio.
Al cabo de algún tiempo, las ratas
del grupo de lugar arribaban a la
meta rápidamente sin importar
desde que punto fueran liberadas
(S1 o S2). Sin embargo, las ratas
del grupo de respuesta mostraban
titubeos en el punto de decisión
cada vez que se les cambiaba el
punto de comienzo.
Aparentemente, la respuesta de
voltear a la derecha entraba en
conflicto con la representación del
lugar donde habían encontrado el
alimento. Según Tolman, esta
oposición de las representaciones
requiere una breve exploración
del ambiente (lo que el llama
ensayo y error vicario) previo a
tomar una decisión.
Explicar los experimentos de Tolman con
diferentes grupos de ratas y como los
mismos demuestran que el organismo puede
hacer una representación interna de su
ambiente (mapas cognoscitivos) y como el
aprendizaje puede darse en ausencia de
refuerzos y que puede haber aprendizaje
aunque de momento no se manifieste
(aprendizaje latente).
Insight
• Se refiere a la repentina integración de los
elementos de una situación, de tal manera que
el sujeto descubre la solución de un problema o
ruta más eficiente.
• El aprendizaje no progresa gradualmente como
resultado de la práctica sino que aparece
después de ensayos no exitosos, en forma
repentina e irreversible.
– Kohler (Gestalt): chimpancé en una jaula con el alimento fuera de su
alcance, reacciona con frustración. Después de observar un rato
descubre un palo que utiliza para acercar el plátano.
Insight
• Kohler consideraba que cuando el animal aprende algo mediante
discernimiento, más que por repetición (de memoria) es menos
probable que olvide la solución. Los monos reestructuraban y
elaboraban un fenómeno Insight. Manejaban a nivel cerebral ciertos
estímulos, los relacionaba y daba una conducta concreta ( Ej.
Monos, plátanos y palos).

• Los críticos plantearon que los chimpancés vivieron libres antes de


ser entrenados y aprendieron mediante ensayo y error. En el
laboratorio se observa que animales muestran insights frente a
problemas que les permiten utilizar habilidades adquiridas
previamente por ensayo y error.
APRENDIZAJE
OBSERVACIONAL,
VICARIO, POR
MODELAMIENTO,
SOCIAL

Albert Bandura
• SOCIAL, porque es un aprendizaje que se efectúa en la
relación social. Experiencia de la conducta de los otros.
• OBSERVACIONAL, porque se ve.
• POR MODELOS, porque la conducta que se observa es
la de un modelo.
• VICARIO, el que recibe el refuerzo es el modelo, el
observador solo lo recibe vicariamente (indirectamente).

- En este modelo se basa la publicidad : Modelos


publicitarios.
Bandura afirmaba que “ Los seres humanos podemos aprender por
experiencias ajenas, no solo por la experiencia propia”. Esto implicaba
3 pasos:
• Prestar atención u observar un comportamiento, del modelo.
• Los comportamientos observados los recordamos.
• En una situación concreta el individuo recuerda y está
motivado para realizarlo él.

Ej. Los niños que observan una conducta agresiva y lo relacionan con
algo bueno, lo recuerdan. Cuando haya conflicto realizarán la
conducta,
-Existe una diferencia entre Modelos Positivos, a imitar. Y Modelos
negativos, a imputar.
Es el aprendizaje basado en una situación social
en la que, al menos, participan dos personas: el
modelo, que realiza una conducta determinada, y
el sujeto, que realiza la observación de dicha
conducta y cuya observación determina el
aprendizaje.

Proceso mediante el cual se aprenden nuevas respuestas,


sin experiencia directa, mediante la observación de los
demás ( modelos).
Aprendizaje
Características del modelo que favorecen la imitación.

• Carácter afectivo y recompensante.


• El control o poder del modelo sobre
el observador.
• Dominancia o estatus social del modelo.
• La semejanza del modelo con el
observador.
• La sinceridad del modelo.
Características del observador que favorecen
la imitación.

• La juventud del observador (se da más imitación


en niños de 4 años que en niños de 9 años).
• La dominancia. Los niños más dominantes imitan
más y son más imitados.
• La inseguridad en sí mismo lleva a mayor
imitación.
• La baja autoestima y la dependencia llevan a
mayor imitación.
CONSECUENCIAS DE APRENDIZAJE POR ESTE MODELO

• Se adquieren conductas muy complejas (no una respuesta corta).


Ej. Para parecerme a tal modelo, hago gimnasia, dieta…

• Inhibición o desinhibición de pautas anteriores.


Ej. Al compartir una conducta agresiva, hace que esa
conducta salga de ti. Aunque hay personas que tienen
mucho autocontrol, otras son muy débiles. Hay diferencias
individuales.

• Efecto provocador. Fenómeno específico de la desinhibición.


Conductas latentes al ver a otro me estimula para hacerlo.
Ej. Ver fumar a alguien, apetece fumar.
Un fumador no va a fumar aunque vea a alguien fumando.

También podría gustarte