Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPITULO 1: INTRODUCCIN
A) ANTECEDENTES HISTRICOS
Los inicios del aprendizaje tienen su raz en la filosofa de Ren Descartes.
Dualismo Cartesiano: 2 tipos de conducta
1) Conducta Involuntaria: Respuestas automticas a los estmulos externos y
est mediada por un mecanismo llamado reflejo.
2) Conducta Voluntaria: No requiere de la intervencin de estmulos externos
sino que se debe a la voluntad consciente de actuar de una determinada forma.
Diagrama del dualismo cartesiano
Mundo fisico
(causa de la
accin inv.)
rganos
sensoriales
Nervios
Accin
voluntaria o
involuntaria
Cerebro
Musculos
Glandula
Pineal
Mente
(causa de la
accin
voluntaria)
Ejemplo: Si nos encontramos con el olor de la salsa de tomate y los espaguetis con
frecuencia, pensaremos en espaguettis con el mero olor de la salsa de tomate.
-
cercanas en una lista quedaban asociadas con mayor fuerza que las que estaban
distantes. Esto lo veo un poco de cajn, pero el libro tampoco da ms datos
Informacin
sensorial
rganos
de los
sentidos
Sistema
nervioso
central
Informacin
Motora
Msculos
Y con todo esto llegamos al siglo XIX y los rusos entran en accin:
-
Darwin critic duramente esta idea y en su libro el origen del hombre postul
que el hombre desciende de algn ser ms primitivo, a pesar de que por el
momento se desconozcan los eslabones intermedios. En opinin de Darwin,
la mente humana es producto de la evolucin y si el ser humano tiene
habilidades mentales como hacerse preguntas, memorizar, o razonar, el resto
de animales posee tambin dichas habilidades.
Neurologia funcional
Nervismo: (Pavlov) De acuerdo con el nervismo, las principales funciones
fisiolgicas estn controladas por el sistema nervioso.
Sin embargoaos ms tarde (1902) surgen dos investigadores britnicos
(Bayliss y Starling) demostraron que el pncreas estaba controlado parcialmente
por factores hormonales y no neurales. Este nuevo descubrimiento le llev a
Pavlov a pensar que por ah no iban los tiros y abandonar su investigacin sobre
la fisiologa del sistema digestivo y centrarse en los reflejos condicionados.
Pavlov consider los estudios de condicionamiento como un medio para obtener
informacin sobre las funciones del sistema nervioso.
Ejemplo: El psiclogo del comportamiento es como un conductor que trata de
descrubir el funcionamiento de un coche conducindolo en lugar de estudiando
el motor.
C) DEFINICIN DE APRENDIZAJE
Segn Domjan: El aprendizaje es un cambio duradero en los mecanismos de conducta
que implica estmulos y/o respuestas especficas y que es resultado de la experiencia
previa con esos estmulos y respuestas o con otros similares
TRMINOS CLAVE
Aprendizaje: Cambio duradero en los mecanismos de conducta que implica estmulos
y/o respuestas especficos y que es resultado de la experiencia previa con esos
estmulos y respuestas o con otros similares.
Asociacin: Conexin entre la representacin mental de dos eventos (dos estmulos o
un estmulo y una respuesta) de forma que la ocurrencia de uno de los eventos activa la
representacin del otro.
Dualismo: Visin de la conducta segn la cual las acciones pueden dividirse en dos
categoras: conducta voluntaria controlada por la mente y conducta involuntaria
controlada por mecanismos reflejos.
Ejecucin: Actividades de un organismo en un momento particular.
Empirismo: Corriente filosfica segn la cual todas las ideas de la mente tienen su
origen en la experiencia.
Fatiga: Disminucin temporal de la conducta provocada por el uso excesivo o repetido
de los msculos involucrados en ella.
Hedonismo: Postura filosfica propuesta por Hobbes segn la cual las acciones de un
organismo estn enteramente determinadas por la persecucin del placer y la evitacin
del dolor.
Maduracin: Cambio en la conducta causado por el desarrollo fsico o fisiolgico del
organismo en ausencia de experiencia con eventos particulares del ambiente.
Innatismo: Postura filosfica segn la cual los seres humanos nacen con ideas innatas.
Nervismo: Postura filosfica adoptada por Pavlov segn la cual todos los procesos
conductuales y fisiolgicos estn regulados por el sistema nervioso.
Reflejo: Mecanismo que permite que un evento especfico del ambiente elicite una
respuesta especfica.
Slaba sin sentido: Combinacin de 3 letras ( dos consonantes separadas por una
vocal) sin significado.
El concepto de reflejo
Un soplo de aire dirigido a la crnea provoca un parpadeo. Esto es un reflejo.
Un reflejo se compone de dos elementos, un estmulo elicitante y su correspondiente
respuesta. Estos dos elementos se comprenden bien mediante la organizacin del
sistema nervioso. En los vertebrados los reflejos simples estn mediados por 3
neuronas:
Neurona sensorial (aferente): capta el estimulo ambiental y transmite el mensaje a
la medula espinal.
Neurona motora (eferente): Activa el msculo involucrado en la respuesta refleja.
Interneurona: Neurona encargada de transmitir los impulsos entre los dos tipos de
neuronas anteriores.
Arco reflejo: Es el conjunto formado por la neurona sensorial, la interneurona y la
neurona motora. En los vertebrados, el arco reflejo representa el numero mnimo de
conexiones neuronales necesarias para que tenga lugar el acto reflejo.
La mayor parte de los reflejos contribuyen al bienestar del organismo. Si pongo la
mano en el fuego la quitar rpidamente, de lo contrario me quedara sin mano, algo
malo para el organismo.
Un reflejo importante en los recin nacidos es el reflejo de oclusin respiratoria: si
algo (prendas, mucosidades) tapona la nariz del beb, su reflejo ser echar la cabeza
hacia atrs buscando aire, si sigue sin encontrar aire comenzar a llorar, lo que
provocar una expulsin vigorosa del aire eliminando cualquier obstruccin de las vias
respiratorias. Esto es especialmente importante cuando le deis (me refiero a las
mujeres) de mamar a vuestro beb, ya que al no poder respirar por la boca (ya que
est ocupada por el pezn) tendr que respirar por la nariz y el resto del pecho no
debe taponarla, de lo contrario empezar a llorar, no querr comer y no sabris
porqu. Los consejos son gratis.
Sin embargo, a pesar de todo esto, puede no darse una respuesta si por alguna razn
los rganos sensoriales pierden temporalmente sensibilidad a la estimulacin. Una
persona puede quedar temporalmente cegada por una luz brillante (adaptacin
sensorial) y una respuesta tampoco tendr lugar si los msculos involucrados
quedan incapacitados por la fatiga.
- La adaptacin sensorial ocurre en los rganos sensoriales
- La fatiga de la respuesta tiene lugar en los msculos efectores
- La habituacin y sensibilizacin tienen lugar en el sistema nervioso
Cambio en
la magnitud
de la
respuesta
Ensayos
Linea Verde: Sensibilizacin
Linea Roja: Habituacin
Linea Negra: NETO (resultado entre la verde y la roja)
Linea Azul: Ni caso, es el eje 0
Ensayos
El sistema E-R se activa siempre que un estmulo elicita una respuesta ya que
es el circuito neuronal que lleva los impulsos desde la entrada sensorial hasta
la salida conductual.
El sistema de estado slo interviene en circunstancias especiales. Algunos
eventos externos (como un ruido intenso) pueden incrementar el estado de
alerta del individuo y sensibilizar el sistema de estado.
TRMINOS CLAVE
Adaptacin sensorial: Reduccin temporal en la sensibilidad de los rganos
sensoriales provocada por la estimulacin repetida o excesiva.
Arco reflejo: Estructura neural que consiste en una neurona aferente (sensorial), una
interneurona y una neurona eferente (motora) y que permite que un estmulo pueda
elicitar una respuesta refleja.
Conducta apetitiva: Conducta que tiene lugar al principio de una secuencia natural
de conducta y que sirve para poner al organismo en contacto con un estmulo
desencadenante.
Conducta consumatoria: Conducta que lleva a consumar o completar una secuencia
natural de conducta. Las respuestas consumatorias son, por lo general, patrones de
accin modal especficos de la especie.
Deshabituacin: Recuperacin de una respuesta habituada como resultado de la
presentacin de un estmulo externo e intenso.
Efecto de habituacin: Disminucin progresiva en el vigor de la conducta elicitada
que puede tener lugar con la presentacin repetida del estmulo elicitante.
Efecto de sensibilizacin: Incremento en el vigor de la conducta elicitada que puede
resultar de la presentacin repetida del estmulo elicitante o de la exposicin a un
estmulo externo intenso.
Estmulo desencadenante: Lo mismo que estmulo seal
Estmulo seal: Rasgo especfico de un objeto o animal que elicita una pauta de
accin modal en otros organismos. Tambin llamado estmulo desencadenante.
Estmulo supranormal: Estmulo seal artificialmente agrandado o exagerado que
elicita una respuesta inusualmente vigorosa.
Fatiga: Disminuacin temporal de la conducta causada por el uso repetido o excesivo
de los msculos involucrados en la conducta.
Respuestas durante EC
(Respuestas durante EC + Respuestas durante Pre EC)
Ejemplo del aprendizaje demorado en ratas: Se les daba a beber agua con sacarina y
luego en diferentes grupos las sometan a radiacin en intervalos de tiempo distintos. El
grupo que se someti a radiacin 6 horas despus de beber desarroll mayor aversin al
agua que el grupo que se le dio radiacin 12 horas despus y este a su vez mayor
aversin que el grupo de las 24 horas.
Todo esto es de cajn, cuanto ms separados en el tiempo estn dos estmulos, menos
posibilidades hay de que yo los relacione, es decir, hay menos posibilidades de que se
produzca condicionamiento.
2 ideas que debemos recordar a modo de conclusin:
- El condicionamiento es ms efectivo cuando el EC es una buena seal de que el EI
aparecer pronto.
- Se produce mejor condicionamiento cuando el intervalo EC-EI es corto.
Hiptesis de codificacin temporal: El sujeto no slo aprende a relacionar EC y EI, sino
que dependiendo del procedimiento utilizado (de los 5 que hemos visto) tambin aprender
cando en el tiempo va a ocurrir EI. (esto se ver en profundidad en el tema 4)
Tenemos un EC+ y un EI. Es un ensayo de tipo excitatorio como los que vimos al
principio. El Estmulo incondicionado ocurre inmediatamente despus del estmulo
condicionado y de esta manera quedan asociados. (ponemos un signo positivo al
EC+ para diferenciarlo del estmulo inhibitorio (EC-) que vemos en el siguiente
ensayo)
A diferencia del ensayo A, aqu no se presenta el EI. Tan slo tenemos un EC+ y un
EC- que se presentar en el contexto excitatorio proporcionado por el EC+. Pero no
se empareja con el EI. Por lo tanto decimos que el EC- es un inhibidor
condicionado.
Al principio del aprendizaje V est cercano a 0 ya que los estmulos que preceden al EI no
los relaciono para nada con EI (por eso es una sorpresa). Como V est cerca de 0, el
resultado de ( - V ) ser bastante grande. Por lo tanto V (la sorpresa) ser mayor al
principio del aprendizaje.
Sin embargo conformen vayamos haciendo ensayos, V va creciendo al incrementarse su
valor de asociacin con el EI. Como V va creciendo, el resultado ( - V ) ser menor. Por
lo tanto V (la sorpresa) ser menor al final del aprendizaje.
Aplicacin al efecto de bloqueo
Final de la primera fase: VA =
Segunda fase: No hay condicionamiento del estmulo B en la fase 2, ya que el EI es
predecible por la presencia del estmulo A:
EI = (-VA+B) = 0
Prdida del valor asociativo a pesar de los emparejamientos con el EI
El modelo Rescola-Wagner predice que los estmulos perdern valor asociativo si se
presentan juntos en un ensayo de condicionamiento despus de haber sido entrenados por
separado.
Fase 1
- Asociamos el estmulo A con una bolita de comida (EI)
- Paralelamente asociamos el estmulo B con la misma bolita de comida (EI)
Ambos estmulos se han condicionado perfectamente, de manera que predicen
perfectamente el EI de una bolita de comida, es decir, VA = VB =
Fase 2
- Presentamos ambos estmulos conjuntos (A y B) con la bolita de comida (EI)
Al no haber cambios en el EI, las propiedades de A y B adquiridas en la fase 1 deberan
mantenerse, y sin embargo el modelo predice que se van a reducir. porqu sucede esto?
Porque la expectativa basada en los estmulos individuales son 2 bolitas de comida y sin
embargo se le presenta 1 nica bolita. Por lo tanto existe una discrepancia entre lo que se
espera (2 bolitas) y lo que se presenta (1 bolita). Los participantes encuentran que el EI es
sorprendentemente pequeo, por lo tanto para ajustar la expectativa a lo que realmente
ocurre, A y B perdern valor.
Inhibicin condicionada (mirar el grfico de la pgina 82 del tema 3 para recordar qu
era la inhibicin condicionada)
La inhibicin condicionada consta de dos tipos de ensayos:
-
Ninguno de los modelos vistos hasta ahora explica los efectos del tiempo sobre el
condicionamiento. Sin embargo el intervalo EC-EI es una variable temporal
importante ya que los intervalos EC-EI ms largos producen menos respuestas. (la
respuesta es inversamente proporcional a la duracin del intervalo)
Experimento en ratas
Se presentaba comida (EI) en un comedero y cada presentacin de la comida va precedida
por un ruido blanco (EC). A medida que avanza el experimento, las ratas comienzan a ir al
comedero y a explorarlo tan pronto escuchan el sonido.
IEE: Intervalo entre ensayos
ED: Duracin del ensayo (es decir, la duracin que tiene el sonido)
La conclusin es que para cada grupo de sujetos, el tiempo dedicado a explorar el
comedero durante la presentacin del EC, vara segn la duracin del EEI y el ED.
Existen distintas interpretaciones sobre porqu la respuesta condicionada est tan
fuertemente determinada por la razn IEE/DE. Vamos a ver dos hiptesis a continuacin.
Hiptesis del tiempo de espera relativo
Un EC proporciona informacin acerca de la aparicin del EI, slo si el sujeto tiene que
pasar menos tiempo esperando al EI tras la presentacin del EC que cuando est
simplemente expuesto al contexto experimental.
-Razn IEE/DE baja = tiempo de espera similar al contexto = EC da poca info sobre aparicin EI
-Razn IEE/DE alta= tiempo de espera menor que el contexto= EC da mucha info sobre aparicin EI
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
A diferencia de los captulos anteriores, en este tema los estmulos a los que un
organismo se enfrenta son resultado de su conducta. Es lo que se conoce como
conducta dirigida a una meta.
Un estudiante estudiar para obtener mejores notas. Este tipo de conducta se utiliza
porque ha servido previamente como instrumento para conseguir lo mismo y recibe el
nombre de conducta instrumental.
B) APROXIMACIONES
MODERNAS
AL
CONDICIONAMIENTO INSTRUMENTAL
ESTUDIO
DEL
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
Procedimientos de operante libre
Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin
restricciones.(a diferencia de los laberintos en T en que el animal era sacado del laberinto
al llegar a meta). Skinner quera obtener una respuesta ms natural en los experimentos.
La observacin informal sugiere que la conducta en curso es un continuo, una actividad
sigue a la otra. Skinner propuso el concepto de operante como la forma de dividir la
conducta en unidades medibles con significado.
Foto pgina 131: Rata hambrienta en una caja de Skinner. Hay una palanca conectada a
un dispensador de comida. Cuando la rata aprieta la palanca cae comida.
La respuesta operante (presionar la palanca) se define a partir del efecto que produce en
el ambiente. El operante de presin de la palanca se define como una presin hacia abajo
suficiente para que cause el cierre del microinterruptor. Da igual si la presin la hace con la
pata izquierda, derecha o con la cola, se trata del mismo operante.
Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un
seguimiento del signo mediante un sonido (condicionamiento clsico) para que el animal se
dirija al comedero. (esto es el entrenamiento al comedero). Tras este entrenamiento el
animal est preparado para aprender la respuesta instrumental. Si la respuesta NO ES
ALGO que el animal ya realiza ocasionalmente NUNCA suceder por si misma la
respuesta que produce el reforzador. Es decir, para empezar le daremos comida a la rata
cada vez que se levanta sobre sus dos patas de forma natural (obviamente si en lugar de
una rata fuera una rana, nunca podr ponerse a dos patas). Cuando hemos conseguido la
respuesta de alzamiento entonces daremos un paso ms y le daremos la comida SOLO SI
realiza la respuesta de alzamiento sobre la palanca. Poco a poco vamos produciendo un
moldeamiento hasta conseguir la respuesta buscada.
Esta dos fases que hemos visto del modeamiento son: reforzamiento de aproximaciones
sucesivas y no reforzamiento de las formas de respuesta tempranas
Moldeamiento y nueva conducta Toda la nueva unidad conductual de la rata est
formada por un conjunto de respuestas preexistentes (alzamiento, presin, etc). Es decir,
se le ensea una nueva combinacin de respuestas familiares en una nueva actividad.
Es importante sealar que el moldeamiento aprovecha la variabilidad inherente de la
conducta. Es decir, se puede variar la conducta en una direccin u otra. El libro habla de
un experimento sobre el picoteo en palomas en el que dependiendo del reforzador
conseguan que su conducta tendiera a ir cerrando ms el pico con el picoteo o lo
contrario, ir abriendo ms el pico con el picoteo.
Con el mismo experimento se obtenan resultados que explicaban que el moldeamiento
puede producir nuevas formas de respuesta nunca antes realizadas por el organismo.
Antes de los experimentos las palomas conseguan abrir el pico 10 mm, pero tras el
moldeamiento llegaban hasta 20 mm.
La tasa de respuesta como medida de la conducta operante Los experimentos con
operante libre permiten una observacin continua durante largos periodos (a diferencia del
ensayo discreto). Skinner propuso la tasa de ocurrencia (frecuencia de la respuesta por
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
minuto) como medida de la probabilidad de una respuesta. Las respuestas ms probables
ocurren con frecuencia y muestran una tasa alta.
C) PROCEDIMIENTOS DE CONDICIONAMIENTO
INSTRUMENTAL
Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos:
-
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
Una respuesta
Una consecuencia (el reforzador)
Relacin (o contingencia) entre la respuesta y la consecuencia
La respuesta instrumental
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
Deriva instintiva: Breland y Breland observaron varias limitaciones y problemas a la hroa
de entrenar animales para realizar exhibiciones en circos. Observaron que los animales
realizaban conductas relacionadas con su forma de alimentacin en lugar de reproducir la
conducta buscada por los educadores.
Sistemas de conducta y limitaciones en el condicionamiento instrumental
De acuerdo con la teora de los sistemas de conducta, cuando un animal est privado de
comida y se encuentra en una situacin donde podra encontrarla, su sistema de
alimentacin se activa y se dedica a otras actividades relacionadas con la comida. De
acuerdo con la aproximacin de los sistemas de conducta, deberamos ser capaces de
predecir qu respuestas se incrementarn con un reforzamiento de comida mediante el
estudio de lo que los animales hacen cuando su sistema de alimentacin est activado en
ausencia de condicionamiento instrumental. Esto suena un poco lioso pero se entiende con
el siguiente ejemplo:
Cuando un hamster tiene comida suficiente se dedica a otras actividades como el
autocuidado (lavarse, etc) pero cuando est hambriento su sistema de conducta se centra
en otras actividades como rascar o comer. Por lo tanto podemos concluir que el
autocuidado no est relacionado con su sistema de conducta de la alimentacin y que el
reforzamiento de comida podra producir incrementos en actividades como cavar y
escarbar pero no en lavarse la cara y rascarse.
2. El reforzador instrumental
Cantidad y naturaleza del reforzador
Las dos caractersticas estn muy relacionadas. Tener un reforzador ms grande o ms
sabroso (en el caso de la comida) provocar respuestas ms intensas en los sujetos.
Cambios en la naturaleza y cantidad del reforzador
Esto est relacionado con el modelo Rescorla-Wagner visto en el tema anterior.
Si el EI es mayor de lo esperado, producir condicionamiento excitatorio. Si por el contrario
el EI es menor de lo esperado, producir condicionamiento inhibitorio. Si trabajas por 9
euros/hora durante 6 meses y el septimo mes te siguen pagando lo mismo, ser menos
emocionante que trabajar 6 meses a 8 euros y luego a partir del septimo mes subirte a 9
euros. Es probable que los trabajadores del segundo grupo sean ms productivos (para
quien tenga psicologa de la motivacin, en la PEC 1 hay un ejercicio que trata este tema)
Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable
resultado de una experiencia anterior con una consecuencia menos atractiva.
Contraste negativo: Se refiere a una respuesta disminuida por una recompensa
desfavorable debido a una experiencia anterior con una consecuencia mejor.
Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes
fases del experimento y slo un cambio en la magnitud de la recompensa para los grupos
de cambio.
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
Contraste conductual simultneo: Efectos de contraste conductual (contraste positivo y
negativo) que estn producidos por frecuentes cambios entre una condicin de
recompensa favorable y una desfavorable, con cada condicin de recompensa asociada
a su propio estmulo distintivo.
Todos los efectos de contraste ilustran que la efectividad de un reforzador en una
situacin est determinada en parte por las experiencias del organismo con reforzadores
en otras situaciones.
3. La relacin respuesta-reforzador
En algunos casos hay una fuerte relacin entre lo que una persona hace y la consecuencia
que sigue, en otros casos no hay ninguna relacin y en otros casos la relacin puede ser
probabilstica. Un organismo debe organizar su tiempo para enfrentarse a varios retos y
debe hacerlo de manera que lleve a cabo el mejor uso de su tiempo y energa.
2 tipos de relaciones entre una respuesta y un reforzador
a) Relacin temporal (o contigidad temporal): Tiempo que transcurre entre la
respuesta y el reforzador. En la Contigidad temporal el reforzador se entrega
inmediatamente despus de la respuesta.
b) Relacin causal: (o contingencia respuesta-reforzador). Se refiere al hecho de que
la respuesta instrumental es necesaria y suficiente para la ocurrencia del
reforzador.
Efectos de la contigidad temporal
El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador
inmediatamente despus de la ocurrencia de la respuesta instrumental facilita el
aprendizaje. Hay varios factores que explican porqu el condicionamiento instrumental es
tan sensible a la demora del reforzamiento:
-
Una demora larga hace que el sujeto no sepa cual de sus respuestas haya sido la
que ha producido el reforzador. Es decir, la rata levanta una palanca pero pasan
30 segundos hasta que se muestra una bolita de comida, durante estos 30
segundos la rata sigue haciendo otras cosas como pueden ser saltar, morder,
etc., de repente surge la bolita y la rata ya no asocia la bolita con la palanca inicial
ya que despus ha seguido dando una serie de respuestas (saltar, morder, etc.) y
no sabe cual de ellas ha sido la que ha propiciado la salida de la bolita.
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
ratas que daba la respuesta correcta se dividi en 2 subgrupos, uno de estos
subgrupos era extraido de la caja en el momento de entrar en el brazo blanco y
llevado a otra caja a experar la comida. El otro subgrupo no era extrado de la caja,
sino que esperaba a recibir la comida en ella durante 60 segundos. Se demostr
que el grupo que era extrado (marcado) de la caja, tena un porcentaje de
respuestas correctas superior en experimentos posteriores que el grupo que no
haba sido extrado. Es decir, hay que hacer algo inmediatamente despus de la
respuesta instrumental para que el animal se percate de que lo que acaba de hacer
es la eleccin correcta.
La contingencia respuesta-reforzador
Repite lo anterior al principio del apartado pero aade que: Aunque la relacin causal sea
perfecta, el condicionamiento no ocurrir si el reforzamiento es demorado durante
demasiado tiempo.
El experimento de supersticin de Skinner
Muy interesante y gracioso: Meti a 8 palomas en 8 cajas distintas que estaban
programadas para dar comida cada 15 segundos independientemente de lo que
estuviesen haciendo las palomas. Al rato volvo y comprob que cada paloma estaba
haciendo una cosa, unas daban vueltas otras picoteaban, etc, como si su comportamiento
condicionara el hecho de que apareciese o no apareciese comida. Skinner denomin a
esto conducta supersticiosa. Seguro que ms de uno hacemos cosas parecidas.
Skinner explica esta conducta mediante la idea del reforzamiento accidental o
adventicio que se refiere al emparejamiento accidental de una respuesta con la entrega
del reforzador. Este experimento sugera que una contingencia positiva respuestareforzador no es necesaria para el condicionamiento instrumental.
Reinterpretacin del experimento de supersticin: Staddon y Simmelhag profundizaron un
poco ms en el experimento de Skinner y dieron nombre a las conductas de las palomas.
Denominaron respuestas terminales a las que se daban al final del intervalo comidacomida y respuestas de intern a las que se daban en medio del intervalo. Las Palomas
solan coincidir en el tipo de respuestas terminales y en el tipo de respuestas intern. Por lo
tanto hay algo de contingencia entre el tipo de respuestas y el reforzador (al contrario de
cmo sugera Skinner)
Explicacin de la periodicidad de las respuestas de intern y terminales: Staddon y
Simmelhag sugirieron que las respuestas terminales son respuestas tpicas de la especie
que reflejan la anticipacin de comida a medida que el tiempo se encuentra ms cerca de
la prxima presentacin de comida. En contraste, las respuestas intern son una
manifestacin de otras fuentes de motivacin que eran ms importantes al comienzo del
intervalo entre comidas, cuando la presentacin de comida era improbable.
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el
orden temporal tras la ltima aparicin de comida:
a) Bsqueda focalizada poscomida (cerca del cuenco)
b) Bsqueda general (lejos del cuenco)
c) - Bsqueda focalizada (cerca del cuenco otra vez)
Efectos de la controlabilidad de los reforzadores
Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la
respuesta instrumental. Un hallazgo importante en experimentos con perros fue que la
exposicin a una descarga incontrolable dificultaba el aprendizaje posterior. Este efecto
recibe el nombre de efecto de indefensin aprendida.
Y ahora 6 puntos que tienen que ver con el efecto de indefensin aprendida:
1. El diseo tridico: (tabla pgina 153)
Los experimentos de indefensin aprendida se realizan utilizando el diseo tridico.
Contiene 2 fases:
a) Exposicin
Grupo de ratas E: Expuesto a descargas peridicas de las que pueden escapar.
Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe
las mismas descargas pero no pueden escapar de ellas.
Grupo C: No recibe descargas pero est confinado en el aparato tanto tiempo como los
otros.
b) Condicionamiento
Los 3 grupos reciben entrenamiento de escape evitacin
Resultados: La exposicin a una descarga incontrolable (Grupo A) produce peores
resultados en el aprendizaje escape-evitacin que el resto de los grupos. La diferencia en
la tasa de aprendizaje entre los grupos muestra que los animales son sensibles a la
contingencia respuesta-reforzador.
2. Hiptesis de la indefensin aprendida: Esta hiptesis asume que durante la exposicin a
descargas incontrolables, los animales aprenden que las descargas son independientes de
su conducta, no pueden hacer nada para controlarlas. Esto dificulta el aprendizaje ya que
la falta de control sobre la situacin hace que descienda la motivacin de los sujetos para
realizar una respuesta instrumental. No confundir con el efecto de indefensin aprendida
que explica el patrn de resultados obtenido con el diseo tridico.
3. Deficit de actividad: Las ratas del Grupo A aprendan a ser inactivas en respuesta a la
descarga durante la fase de exposicin.
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS
4. Deficit atencional: Una descarga inescapable hace que los animales presten menos
atencin a sus acciones (ya que han aprendido que van a recibir la descarga hagan lo que
hagan). Sin embargo marcar la respuesta instrumental supera el dficit de indefensin
aprendida.
5.Relaciones estimulares en el condicionamiento de escape: El rasgo definitorio de la
conducta de escape es que la respuesta instrumental tiene como consecuencia la
terminacin del estmulo aversivo. Adems, la respuesta de escape tiene como resultado
claves internas de retroalimentacin de la respuesta. Hay dos:
-
En un experimento con palomas, una reforzada con RV y la otra con IV, se comprob que
la paloma reforzada con el programa de RV respondi a una tasa mucho ms alta que la
paloma reforzada con el programa de IV. El programa de RV motiv una conducta
instrumental mucho ms vigorosa.
Reforzamiento diferencial del tiempo interrespuesta: El intervalo entre una respuesta y
la siguiente se denomina tiempo interrespuesta o TIR. Un sujeto que produce TIR cortos
responder a una tasa alta y si produce TIR largos, su tasa ser baja.
Un programa de razn favorece los TIR cortos (es la respuesta del sujeto la que determina
cuando acceder a la comida, por lo tanto cuanto ms rpida se produzca esa respuesta
(TIR corto), antes acceder a la comida. Por el contrario, un programa de intervalo
favorece los TIR largos.
Programas de reforzamiento de tasas de respuesta
Los programas de tasas de respuesta requieren especficamente que el organismo
responda a una tasa particular para obtener el reforzador. Es como una mezcla de los dos
anteriores (tiempo y nmero). Por ejemplo un programa de reforzamiento en el que una
respuesta se refuerce slo si ocurre dentro de los 5 segundos siguientes a la respuesta
precedente. Si el animal realiza una respuesta cada 5 segundos, su tasa de respuesta ser
de 12 por minuto. Por lo tanto habr reforzamiento si la tasa de respuesta es de 12 por
minuto o mayor. Si la tasa de respuesta es menor, el organismo no ser reforzado. Esto
recibe el nombre de Reforzamiento diferencial de tasas altas, o RDA.
Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza slo si
ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta
precedente. Estos programas fomentan que los sujetos respondan rpidamente.
Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza slo si
ocurre despus de que haya transcurrido cierta cantidad de tiempo tras la respuesta
precedente. Estos programas fomentan que los sujetos respondan lentamente.
Si la paloma picotea igualmente en las dos teclas de respuesta, la razn ser 0,5.
Si la tasa de respuesta es mayor en A que en B, la razn ser mayor que 0,5.
Si la tasa de respuesta es menor en A que en B, la razn ser menor que 0,5.
RA =(RA+RO) rA / (rA+rO)
La teora del mejoramiento asume que los organismos cambian de una alternativa de
respuesta a otra para mejorar la tasa local de reforzamiento que estn recibiendo. El
mecanismo de mejoramiento da como resultado la igualacin.
Esta teora sostiene que un organismo cambiar su preferencia en favor de la alternativa
de respuesta que arroje la tasa local de reforzamiento ms alta.
Un sujeto est motivado para obtener un reforzador. Pero qu significa estar motivado?
Existen dos perspectivas que intentan dar solucin a este problema:
1. Estructura asociativa del condicionamiento instrumental: (Thorndike). Toma una
perspectiva molecular. Se centra en las respuestas individuales y sus antecedentes
estimulares y consecuencias especficas.
2. Regulacin conductual: (tradicin skinneriana): El condicionamiento instrumental se
considera desde un contexto ms amplio, es decir, desde una perspectiva molar. Se
analizan las opciones conductuales del organismo para alcanzar las metas, por lo tanto
es una perspectiva ms funcional.
Y ahora vamos a ver cada una de las dos en mayor profundidad
1.ESTRUCTURA
INSTRUMENTAL
ASOCIATIVA
DEL
CONDICIONAMIENTO
Estos 3 sucesos se relacionan entre s creando distintos tipos de relaciones que vamos a ver a
continuacin.
La asociacin E-R y la ley del efecto
El papel del reforzador (C) es establecer una asociacin entre las claves contextuales (E) y la
respuesta instrumental (R).
La ley del efecto asume que el nico papel del reforzador es crear una asociacin E-R, ya que
el reforzador (C) no participa en esta asociacin.
Expectativa de recompensa y la asociacin E-C
Los procesos pavlovianos son importantes en este tipo de asociacin. El reforzamiento de la
respuesta (R) producir una asociacin entre el contexto estimular (E) y la consecuencia de la
respuesta (C).
Hull estableci que la respuesta instrumental era motivada por dos factores:
a) (E) evoca la respuesta directamente por asociacin con (R)
b) La actividad instrumental tambin llega a realizarse en respuesta a la expectativa de
recompensa debido al establecimiento de una asociacin R-C.
La teora moderna de los dos procesos: Esta teora asume que hay 2 tipos de aprendizaje,
el condicionamiento pavloviano y el instrumental y estn relacionados de una forma especial:
centrales
condicionados
expectativas
especficas
de
2. REGULACIN CONDUCTUAL
Los anlisis de la regulacin conductual se centran en cmo las contingencias instrumentales
ponen limitaciones a las actividades de un organismo.
Antecedentes de la regulacin conductual
Al principio se consideraba que los reforzadores eran unos estmulos especiales que fortalecan
la conducta instrumental.
La teora de la respuesta consumatoria: (Fred Sheffield)- Las respuestas consumatorias
tpicas de la especie (comer, beber, etc) son en s mismas el rasgo crtico de los reforzadores.
Se consider que las respuestas reforzadoras eran especiales porque involucraban la
consumacin o completamiento de una secuencia instintiva de conducta.
El principio de Premack: Las respuestas incluidas en los reforzadores comnmente utilizados
son actividades que es altamente probable que realicen los animales (respuesta de comer en
una rata privada de comida). Por el contrario las respuestas instrumentales son actividades que
normalmente ocurren a una baja probabilidad (respuesta de presionar una palanca).
Y a continuacin el enunciado de este principio como Dios manda:
Dadas dos respuestas de diferente probabilidad, A y B, la oportunidad para realizar la
respuesta de alta probabilidad A despus de la respuesta de baja probabilidad B tendr
como resultado el reforzamiento de la respuesta B. La oportunidad para realizar la
respuesta B de baja probabilidad despus de la respuesta A de alta probabilidad no dar
como resultado el reforzamiento de la respuesta A
(B A refuerza B)
(A B no refuerza A)
La meta es comprender cmo la conducta instrumental (gasto) est controlada por las
contingencias instrumentales (precios).
Determinantes de la elasticidad de la demanda: Existen 3 factores que influyen en cmo
las restricciones de un programa moldean la redistribucin de la conducta:
1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un artculo
producen una disminucin en el consumo depende de la disponibilidad (y precio) de otros
bienes que puedan utilizarse en sustitucin del artculo original. La disponibilidad de
sustitutos aumenta la sensibilidad del artculo original a los precios altos. Si algo aumenta
de precio y yo tengo una alternativa, dejar de comprarlo rpidamente y adquirir la
segunda alternativa. (el caf es sustituto del te ya que ambos contienen cafeina).
-
2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en
precios altos. En un rango de precios bajos, la demanda de comida no es elstica. (no
olvidemos que cuando hablamos de precio nos estamos refiriendo al nmero de
respuestas para obtener un reforzador).
3. Nivel de ingresos: Cuanto ms salario, menos se desanimar un consumidor con los
incrementos del precio. Extrapolando esto a los programas de reforzamiento, el nmero de
respuestas o el tiempo disponible para responder corresponde a los ingresos, por lo tanto
cuantas ms respuestas o tiempo tengan disponibles los animales, menos estar su
conducta influida por los aumentos en el coste del reforzador.
Problemas con las aproximaciones de regulacin conductual
-
Otro problema es que las respuestas durante un perodo de lnea de base libre no
siempre tienen el mismo valor como respuestas que ocurren como parte de una
contingencia instrumental impuesta. Es decir, debemos asumir que estudiar en
ausencia de una restriccin de respuesta impuesta externamente tiene que tener el
mismo valor que estudiar para obtener acceso a la TV. Sin embargo esto es
incorrecto, correr por placer es diferente que cuando se requiere por una
contingencia instrumental impuesta (correr en una clase de gymnasia).
3. COMENTARIOS FINALES
En este apartado se realiza una comparacin a nivel general entre el punto 1 y el 2 de este
tema, es decir, la estructura asociativa y la regulacin conductual.
Caractersticas propias de cada teora que no comparte con la otra
Asociacionismo
- Concepto de asociacin
- Exploracin de los circuitos neuronales
- Nivel molecular: El objetivo son los estmulos especficos, las respuestas y sus
conexiones.
- Est relacionada con procesos especficos (asociaciones E-R, E-C, R-C, etc)
Regulacin conductual
- Concepto de regulacin conductual (puntos de deleite y restricciones del programa)
- Poca aplicacin neurolgica
- Nivel molar de agregados de conducta.
- Est relacionada con metas a largo plazo
Si un gradiente es muy plano (grfico pg 222) quiere decir que el rasgo que se
vara en la prueba de generalizacin no controla la conducta instrumental. Por
ejemplo, las palomas ciegas como no vean las diferencias en los colores, seguan
Por el contrario, si el gradiente es muy acusado (grfico 221) quiere decir que el
organismo responde en mayor medida a algunos estmulos de prueba que a otros.
Reforzamiento positivo (comida) con tono y luz roja: Respondieron ms a la luz roja
Reforzamiento negativo (descarga) con tono y luz roja: Respondieron ms al tono
Esto se puede explicar por los sistemas de conducta que se activan en cada caso. En el
caso de la alimentacin las claves visuales son ms dominantes (luz roja) mientras que en
el caso de evitar el peligro son ms importantes los tonos (el animal oye a un depredador
acercarse)
Por lo tanto, para una misma combinacin de estmulos se pueden dar respuestas
diferentes dependiendo del tipo de condicionamiento empleado, debido al sistema de
conducta que se activa en cada caso.
Tipos de respuesta instrumental
Otro factor importante es el tipo de respuesta requerida para el refozamiento. En un
experimento con perros se demostr que las respuestas que se diferencian por la
localizacin (levantar la para derecha/levantar la pata izquierda) es ms probable que
estn bajo el control de la caracterstica especial de las claves auditivas. Por el contrario
las respuestas que se diferencian por la naturaleza (hacer/no hacer) es ms probable que
lleguen a estar bajo el control de la naturaleza de la clave auditiva.
Respuestas de localizacin (levantar derecha o izquierda) Localizacin clave auditiva
Respuestas de naturaleza de la accin (hacer o no hacer) Tipo de clave auditiva
Aunque esto parezca un poco complejo de entender, en realidad es bastante sencillo. El
experimento en perros que se explica en las pginas 226-228 lo deja bastante claro.
A todo este fenmeno lo llamamos: efecto de la naturaleza-localizacin
El efecto de naturaleza-localizacin es un ejemplo de asociacin selectiva. Hay otros
ejemplos de asociacin selectiva:
Claves relacionadas con el sabor Asociadas con la enfermedad
Claves audiovisuales Asociadas con descarga elctrica
Elementos del estmulo frente a claves configuracionales en los estmulos
compuestos
Aproximacin elemental del estmulo: Los distintos elementos que forman un estmulo
(localizacin, color, sonido, etc) son tratados por el organismo como rasgos distintivos y
sepadados del ambiente.
Aproximacin de la clave configuracional: (es lo contrario a lo anterior): Los estmulos
son percibidos como un todo integral y no se dividen en partes ms pequeas.
Ejemplo metafrico con una orquesta: Como aproximacin elemental sera fijarnos en
como suena la msica que emite cada integrante (flauta, clarinete, tambores, etc) y como
aproximacin configuracional sera analizar cmo suena la pieza musical en s cuando
todos la tocan al unsono.
Aunque parezcan aproximaciones opuestas, se han elaborado teoras para unificarlas. Se
piensa que en ciertas circunstancias predomina el control elemental mientras que en otras
condiciones predomina el control de las caractersticas configuracionales.
los
Otras terminologas:
(En el condicionamiento pavloviano)
Facilitacin: Es otro nombre con el que se conoce al control condicional de la respuesta,
debido a que el modulador facilita la respuesta al EC.
Facilitador: Otro nombre con el que se conoce al modulador.
(en el condicionamiento clsico)
Establecimiento de la ocasin: lo mismo que facilitacin
Establecedor de la ocasin: lo mismo que facilitador
Distincin entre la excitacin y la modulacin
-
que como una clave configuracional combinada. Por tanto, los efectos modulatorios
requieren la respuesta al compuesto estimular como constituido por elementos
independientes estimulares.
Compuesto serial: Para promover que los organismos traten los compuestos estimulares
como construidos por elementos independientes, los investigadores presentan los
elementos uno tras otro, en lugar de simultneamente.
Estos efectos se muestran en un experimento con ratas en el que la extincin produjo una
disminucin en el nmero de secuencias de respuesta que los sujetos realizaban pero
aument la variabilidad de esas secuencias. Sin embargo es importante sealar que aparte
de la variabilidad de respuestas tambin segua dndose la respuesta inicial previa a la
extincin, por lo tanto podemos decir que la estructura bsica de la conducta instrumental
se altera muy poco por el hecho de introducir la extincin.
Por lo tanto: La extincin disminuye la tasa de respuesta e incrementa la variabilidad de
respuesta, pero no altera de otro modo la estructura de la conducta.
Adems de estos efectos podemos encontrar otros efectos emocionales como
consecuencia de la extincin:
Frustracin: Reaccin emocional inducida por la falta de un reforzador esperado. Puede
derivar en agresin.
presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de
extincin.
Recuperacin espontnea tras el condicionamiento instrumental: (la explicacin es
ms o menos la misma que en el ejemplo pavloviano anterior). En un experimento con
ratas se demostr que la respuesta cuya recuperacin se comprob tras un perodo de
descanso posterior a la extincin (R-Descanso) se dio a una tasa mucho ms alta que la
respuesta cuya recuperacin se midi sin un perodo de descanso posterior a la extincin
(R-No descanso).
Por lo tanto: La introduccin de un perodo de descanso tras la extincin produjo una
recuperacin sustancial en la respuesta.
Renovacin del condicionamiento excitatorio original
Renovacin: Se refiere a la recuperacin de la ejecucin propia de la adquisicin que se
da cuando se cambian las claves contextuales que estaban presentes durante la extincin.
En un experimento con ratas se comprob que un miedo condicionado y posteriormente
extinguido se renovava cuando se retiraba al grupo de ratas del nuevo contexto y se volva
a introducir en el contexto original de aprendizaje.
Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la prdida de
supresin durante la fase de extincin no refleja desaprendizaje de la respuesta de miedo
condicionado. Es decir, a pesar de la extincin y de que las ratas han dejado de dar la
respuesta, al cambiarlas de contexto la recuperan, por lo tanto nunca la desaprendieron.
La renovacin tambin puede darse si el sujeto se retira del contexto de adquisicin a un
contexto alternativo que no es el de la adquisicin original. Sin embargo en este caso la
renovacin no es tan slida como cuando se lleva al contexto original.
Otra explicacin de la renovacin: propiedades excitatorias condicionadas del contexto de
renovacin:
1) Contexto A: Adquisicin original
2) Contexto B. Extincin
3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ah donde se produjo
la adquisicin.
Sin embargo algunos experimentos han demostrado que esto no es asentonces para
qu nos lo hacen estudiar????
Implicacin en la terapia de conducta: Aunque un procedimiento terapetico sea efectivo
extinguiendo una fobia en la seguridad de una sala de consulta del terapeuta, el miedo
condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de
miedo en un contexto diferente.
Para reducir el efecto de renovacin, investigadores han llevado a cabo la extincin en
distintos contextos.
3- QU SE APRENDE EN LA EXTINCIN?
Asociaciones E-R inhibitorias
La falta de reforzamiento produce una asociacin E-R inhibitoria.
porqu ocurre esto?
En realidad la extincin implica un tipo especial de ausencia de reforzamiento, es decir, se
trata de ausencia de reforzamiento tras una historia de reforzamiento. La ausencia de
reforzamiento sin esta historia previa no es extincin, sino ms bien habituacin. La
ausencia de reforzamiento resulta aversiva slo despus de darse una historia de
reforzamiento. Por lo tanto los efectos emocionales de la ausencia de reforzamiento
dependen de forma crtica de la historia previa del sujeto. Si tu pareja nunca te ha hecho
caf por la maana, no te sentirs desilusionado cuando te despiertes y veas que no hay
caf.
Los efectos de la extincin son tanto conductuales como emocionales. Los efectos
emocionales se originan en la frustracin que se desencadena cuando un reforzador
esperado no llega. Se supone que la ausencia de reforzamiento cuando se espera
La idea del momento conductual resulta intrigante porque intenta captar en un nico
concepto la resistencia de la conducta a diversas posibilidades de cambio. El concepto
fuerza de la respuesta est relacionado con esto.