Está en la página 1de 86

Principios de Aprendizaje y conducta

CAPITULO 1: INTRODUCCIN

A) ANTECEDENTES HISTRICOS

Los inicios del aprendizaje tienen su raz en la filosofa de Ren Descartes.

Dualismo Cartesiano: 2 tipos de conducta

1) Conducta Involuntaria: Respuestas automticas a los estmulos externos y
est mediada por un mecanismo llamado reflejo.

2) Conducta Voluntaria: No requiere de la intervencin de estmulos externos
sino que se debe a la voluntad consciente de actuar de una determinada forma.

Diagrama del dualismo cartesiano

Mundo fisico
(causa de la
accin inv.)











Desarrollo histrico del estudio de la mente

Innatismo: (Descartes) Nacemos con ideas innatas acerca de ciertas cosas. Es
lo que se conoce como Postura nativista.

Empirismo: (John Locke) Todas las ideas de las personas eran aprendidas
directa o indirectamente a travs de experiencias posteriores al nacimiento.
Modelo adoptado por filsofos britnicos entre XVII-XIX. A los seguidores se les
conocera como Empiristas britnicos.

Descartes tambin pensaba que la mente no operaba de forma predecible y
ordenada. El Hedonismo surge como una alternativa a este pensamiento.

Hedonismo: (Thomas Hobbes) Para los hedonistas, la mente opera de forma
predecible y conforme a leyes. Las personas siempre tratarn de lograr el placer
y evitar el dolor.

rganos
sensoriales


Cerebro

Glandula
Pineal


Mente

Musculos

Accin
voluntaria o
involuntaria
(causa de la
accin
voluntaria)
Nervios
Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

Concepto de asociacin: Concepto importante para los empiristas britnicos
para explicar el funcionamiento de la mente. Las sensaciones simples se
combinan hasta formas ideas complejas por medio de asociaciones.

Ejemplo

- Idea simple: Oir la palabra coche
- Idea simple: Recuerdo que evoca la palabra coche sobre experiencias
anteriores que hemos vivido con los coches.

Estas dos ideas simples se combinan y tenemos:

- Idea compleja: Nos formamos una idea de su apariencia, de su utilidad y de
cmo nos sentiramos sentados en el.

Leyes de asociacin

Leyes primarias: (Origen en Aristteles) contigidad, similitud y contraste

- Contigidad: La ms importante en el estudio de las asociaciones. Si dos
eventos ocurren juntos en el espacio o en el tiempo de forma repetida
quedarn asociados.

Ejemplo: Si nos encontramos con el olor de la salsa de tomate y los espaguetis con
frecuencia, pensaremos en espaguettis con el mero olor de la salsa de tomate.

- Similitud y contraste: Dos ideas se asocian si son similares en algn aspecto
(las dos son rojas) o si tienen alguna caracterstica contraria (diferencia de
tamao).

Leyes secundarias: (Thomas Brown 1778-1820). La formacin de asociaciones entre
dos sensaciones estaba influida por un nmero de factores, incluyendo la intensidad
de las sensaciones y la frecuencia y recencia con que las dos sensaciones ocurran
conjuntamente. Adems se consideraba que la formacin de una asociacin entre
dos eventos dependa del nmero de asociaciones anteriores en las que cada uno
de dichos eventos estaba involucrado, y la similitud entre estas asociaciones
pasadas y la que se forma en el presente.

Sin embargo los empiristas britnicos no estudiaron en profundidad las leyes de
asociacinhasta que lleg el psiclogo alemn Hermann Ebbinghaus!!! (1850-
1909) quien invent las Slabas sin sentidoy qu es esto???

Slabas sin sentido: Combinaciones de 3 letras (bap por ejemplo) despojadas de
cualquier significado que pudiera influir en cmo se reaccionaba entre ellas. El
alemn este, Ebbinghaus, se utiliz a si mismo para medir su capacidad de
recordarlas en diferentes condiciones experimentales. Comprob que la fuerza de
las asociaciones mejoraba con el entrenamiento y que las slabas que aparecan
Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

cercanas en una lista quedaban asociadas con mayor fuerza que las que estaban
distantes. Esto lo veo un poco de cajn, pero el libro tampoco da ms datos

Desarrollo histrico del estudio de los reflejos

Descartes pensaba que los mensajes que iban de los rganos de los sentidos al
cerebro y los mensajes motores que iban del cerebro a los msculos viajaban
por los mismos nervios. Descartes Pensaba que los nervios eran tubos huecos
por los que se desplazaban unos gases llamados espritus animalesno
comment.


Como es obvio, siglos posteriores a la muerte de Descartes, todas estas ideas
acerca de los reflejos resultaron ser errneas.

Charles Bell y Franois Magendie demostraron que eran fibras nerviosas distintas
las que se encargaban de transmitir la informacin sensorial desde los rganos de
los sentidos hasta el sistema nervioso central y otras fibras que transmitan la
informacin motora desde el sistema nervioso central hasta los msculos.














- En 1669 John Swamerdamm mostr que la irritacin mecnica de un nervio era
suficiente para producir una contraccin muscular, asi que lo de los espiritus
animales desde la glandula pineal era innecesario.

- Posteriormente, Francis Glisson demostr que las contracciones musculares no se
deban a que los msculos fueran hinchados por un gas.
Osea que toda esta gente tir por tierra las elaboradas suposiciones que siglos antes
haba formulado Descartes






Sistema
nervioso
central
Msculos
rganos
de los
sentidos



Informacin
sensorial
Informacin
Motora
Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

Y con todo esto llegamos al siglo XIX y los rusos entran en accin:

- I.M Sechenov (1829-1905) Propuso que los estmulos no siempre elicitan
respuestas reflejas de forma directa. En algunos casos un estmulo puede
liberar una respuesta que estaba inhibida y la fuerza de la respuesta no
depender de la intensidad del estmulo. Ejemplo: Pequeas partculas de
polvo pueden liberar un potente estornudo. Segn Sechenov, la conducta
voluntaria y los pensamientos estn en realidad elicitados (generados) por
estmulos dbiles y apenas visibles.

Sin embargo el trabajo de Sechenov tena un fallo: No tuvo en consideracin que a
lo largo de la vida de un individuo, su respuesta ante un estmulo puede variar
debido a la experiencia. Y aqu es donde lleg el padre del cordero (o mejor dicho,
del perro): Ivan Pavlov


- Ivan Pavlov (1849 1936): Demostr experimentalmente que no todos los
reflejos son innatos. Mediante mecanismos asociativos se pueden establecer
nuevos reflejos para estmulos. Su papel fue similar al del alemn que
hablabamos antes, Ebbinghaus, pero Pavlov realiz su trabajo desde la
tradicin filosfica de la reflexologa.


B) EL AMANECER DE UNA NUEVA ERA

La cognicin comparada y la evolucin de la inteligencia

Descartes pensaba que los humanos eran los nicos animales que posean mente.
Y cmo no, no tardaron en surgir autores que dejaran por el suelo al pobre
Descartes.

- Darwin critic duramente esta idea y en su libro el origen del hombre postul
que el hombre desciende de algn ser ms primitivo, a pesar de que por el
momento se desconozcan los eslabones intermedios. En opinin de Darwin,
la mente humana es producto de la evolucin y si el ser humano tiene
habilidades mentales como hacerse preguntas, memorizar, o razonar, el resto
de animales posee tambin dichas habilidades.

- George Romanes: Defini la inteligencia a partir de la capacidad de aprender.
Esta definicin fue ampliamente aceptada a finales del XIX y principios del XX.






Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

Neurologia funcional

Nervismo: (Pavlov) De acuerdo con el nervismo, las principales funciones
fisiolgicas estn controladas por el sistema nervioso.

Sin embargoaos ms tarde (1902) surgen dos investigadores britnicos
(Bayliss y Starling) demostraron que el pncreas estaba controlado parcialmente
por factores hormonales y no neurales. Este nuevo descubrimiento le llev a
Pavlov a pensar que por ah no iban los tiros y abandonar su investigacin sobre
la fisiologa del sistema digestivo y centrarse en los reflejos condicionados.

Pavlov consider los estudios de condicionamiento como un medio para obtener
informacin sobre las funciones del sistema nervioso.

Ejemplo: El psiclogo del comportamiento es como un conductor que trata de
descrubir el funcionamiento de un coche conducindolo en lugar de estudiando
el motor.


Modelos animales de la conducta humana

Se pensaba que la investigacin con animales podra proporcionar informacin til para
la comprensin del comportamiento humano.

Los modelos animales permiten investigar problemas que son difciles o imposibles de
estudiar directamente en personas. Un modelo permite realizar la investigacin en
condiciones ms sencillas, mejor controladas y ms econmicas.

Por ejemplo: La similitud entre las ratas y los humanos en la forma de evitar comidas
peligrosas hace que la rata sea un modelo vlido para investigar el aprendizaje de
aversin a la comida en humanos. El hecho de que las ratas tengan cola y de que
caminen a 4 patas es irrelevante para el estudio de la seleccin de alimentos.

Lo ms importante a la hora de construir un modelo animal til es identificar las
similitudes relevantes entre el modelo animal y la conducta humana en cuestin.

Dollard y Miller fueron partidarios de una integracin en la que los estudios de laboratorio
realizados con animales no humanos se usaran para aislar e identificar los fenmenos
que podran ser estudiados posteriormente con xito en las personas.

Modelos animales y robtica

La meta de la robtica es hacer mquinas tan inteligentes como sea posible. Los
ingenieros actuales contemplan la capacidad de recordar y aprender a partir de
la experiencia como un rasgo importante de los sistemas artificiales inteligentes.
Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

(esto guarda relacin con la definicin comentada anteriormente de Romanes
sobre la inteligencia)


C) DEFINICIN DE APRENDIZAJE

Segn Domjan: El aprendizaje es un cambio duradero en los mecanismos de conducta
que implica estmulos y/o respuestas especficas y que es resultado de la experiencia
previa con esos estmulos y respuestas o con otros similares

Distincin entre aprendizaje y ejecucin

Acerca de la definicin anterior es importante puntualizar que atribuye el
aprendizaje a un cambio en los mecanismos de conducta, no a un cambio directo
en la conducta. Esto es importante ya que pueden haber cambios en la conducta
que no sean consecuencia de un aprendizaje

Ejecucin: Se refiere a las acciones de un organismo en un momento concreto.
Que hagamos (o no) algo depende de muchas cosas, como la motivacin,
capacidades sensoriales, etc, adems del aprendizaje.

Que un nio se tire (ejecucin) a una piscina es algo que est determinado por otras
cosas (lo fria que est el agua, la motivacin por tirarse, la profundidad etc.), adems del
aprendizaje. No podemos afirmar que el hecho de tirarse se deba exclusivamente al
aprendizaje.

El aprendizaje y otras fuentes de cambio conductual

Existen cambios en la conducta tan breves que no pueden ser considerados
como ejemplos de aprendizaje:

Fatiga: El esfuerzo fsico debilita gradualmente la fuerza de una respuesta.

Cambio en las condiciones estimulares: Encender las luces a mitad de la
pelcula en el cine provoca una respuesta en los espectadores.

Estado Fisiolgico o motivacional del organismo: El hambre y la sed
provocan respuestas que no se observan en otros momentos.

Maduracin: Un nio crece y alcanza una estantera a la que antes no llegaba.
No se considera aprendizaje ya que es un cambio debido al paso del tiempo.





Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

Diferentes tipos de mecanismos causales

Existen 4 tipos de causas descritos por Aristteles:

Causa eficiente: Es la experiencia anterior con estmulos y/o respuestas
especficos que produce el cambio en la conducta que seala la presencia del
aprendizaje.

Causa material: Hacen referencia a los cambios fsicos en el sistema nervioso
que median en el aprendizaje.

Causa formal: Las causas formales son las teoras o modelos de aprendizaje. Estas
teroras o modelos pueden expresarse en trminos matemticos o computacionales.

Causa final: La causa final de un comportamiento o de cualquier proceso biolgico es
cmo ese proceso contribuye al xito reproductivo del organismo. La causa final se mide
a partir del nmero de descendientes de un organismo.


D) ASPECTOS METODOLGICOS DEL ESTUDIO DEL APRENDIZAJE


El aprendizaje como ciencia experimental

Los investigadores del aprendizaje han centrado su atencin en las causas eficientes,
materiales y formales. Las causas no pueden observarse directamente. Tan slo pueden
ser inferidas a partir de los resultados de las manipulaciones experimentales.

Si una persona entra en una habitacin a oscuras, pulsa un interruptor y se enciende la
luz, no podemos concluir que accionar el interruptor sea la causa de que la luz se haya
encendido. Puede haber un detector de movimiento que haya detectado la presencia de
la persona y haya encendido la luz. Para descartar esta posibilidad, la persona debera
entrar de nuevo a la habitacin y no pulsar el interruptor para ver qu ocurre.

Para identificar una causa se requiere la realizacin de una prueba en ausencia de dicha
causa. Entonces podremos comparar los resultados obtenidos en presencia y en
ausencia de la presunta causa. La pregunta tpica es si un procedimiento produce un
efecto de aprendizaje en particular. Para responder a esta pregunta, hay que comparar
las acciones de los individuos que previamente han sido expuestos al procedimiento en
cuestin con las acciones de los individuos que no han sido expuestos a dicho
procedimiento.





Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

La perspectiva de proceso general en el estudio del aprendizaje

Elementos de la perspectiva de proceso general

La caracterstica ms obvia de la naturaleza es su diversidad. Sin embargo todos los
cientficos han optado por fijarse en los aspectos comunes a la hora de estudiarla. Han
tratado de formular leyes generales con las que organizar y explicar la diversidad de los
eventos del universo. Los investigadores del aprendizaje animal han seguido esta
tradicin.

Un presupuesto fundamental en la perspectiva de proceso general es que los fenmenos
estudiados son el resultado de procesos ms elementales. Adems se supone que estos
procesos elementales operan de forma similar independientemente de donde se
encuentren. Los investigadores del condicionamiento y el aprendizaje se han adherido a
esta perspectiva de proceso general desde los comienzos de esta rea de estudio en
psicologa.

Darwin, Pavlov o C. Lloyd Morgan seguan esta perspectiva. Crean en la existencia de
leyes universales (por ejemplo las leyes de asociacin) para todas las especies, aunque
tambin afirmaban que cada especie poda tener un ritmo diferente de aprendizaje para
unas mismas leyes elementales.


Implicaciones metodolgicas de la perspectiva de proceso general

La principal implicacin metodolgica de esta perspectiva es que se pueden descubrir
los principios de aprendizaje estudiando cualquier especie o sistema de respuesta que
demuestre aprendizaje. Esta implicacin ha llevado a una estandarizacin en la
comunidad cientfica de los paradigmas experimentales. (pedazo frase esta ltima que
no hay por dnde cogerlaviene a decir algo as como que todos los cientficos utilizan
ms o menos los mismos experimentos a la hora de realizar sus estudios. El libro habla
sobre la Paloma en su caja de Skinner tpica que dependiendo del botn que pulse
recibir alimento o no)

Demostracin de la generalidad de los fenmenos de aprendizaje

Es importante tener en mente que la adopcin de la perspectiva de proceso general no
prueba la generalidad de los procesos de aprendizaje. Una teora general no puede
verificarse empricamente utilizando unos pocos paradigmas experimentales
estandarizados. La generalidad del aprendizaje debe probarse realizando estudios en
distintas especies y situaciones.





Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

E) USO DE ANIMALES NO HUMANOS EN LA INVESTIGACIN SOBRE
APRENDIZAJE.

Razones del uso de animales no humanos en la investigacin sobre
aprendizaje

Con los animales de laboratorio los cientficos pueden estudiar cmo se aprenden
las reacciones emocionales intensas. Sin embargo, con las personas, los
investigadores se ven limitados a tratar de modificar las respuestas emocionales
inadaptadas una vez que stas ya han sido aprendidas. Para modificar esta
respuesta tienen que comprender cmo se aprendi, y es por esta razn por la que
se estudian las respuestas emocionales en los animales de laboratorio y extrapolan
la conclusin a los seres humanos.

Una de las preguntas fundamentales acerca de la naturaleza humana es cmo
evolucionaron la cognicin y la inteligencia. Por ello la investigacin sobre la
evolucin de la cognicin y la inteligencia se apoya fuertemente en estudios de
aprendizaje realizado con animales.

Ventajas de utilizar animales de laboratorio en lugar de personas

- Los procesos de aprendizaje suelen ser ms simples
- El comportamiento de los animales no se ve complicado por procesos
lingsticos
- No es necesario hacer peticiones explcitas a los sujetos
- El investigador no debe preocuparse sobre si los actos de los participantes
no estn influidos por el deseo de complacer al investigador.


Los animales de laboratorio y la conducta normal

La tica de la investigacin con animales de laboratorio

Han surgido reglas estrictas que obligan a los laboratorios a tratar bien a los
animales. Sin embargo se olvida que aunque no existan estas reglas, los cientficos
siempre los trataran bien, ya que la informacin extrada a partir de experimentos a
animales enfermos o ansiosos no es fiable. Por lo tanto los propios cientficos son
los primeros interesados en el bienestar de sus sujetos experimentales.

A veces los experimentos conllevan incomodidades, como la privacin de comida o
estimulos aversivos. Algunos temas importantes, como el castigo o el
condicionamiento del miedo no pueden estudiarse sin alguna incomodidad por
parte del sujeto. Los estudios de aprendizaje del miedo utilizan a menudo
descargas elctricas, pero de baja intensidad.

Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

Qu constituye un trato humano a los animales?

Asumiendo que una especie merece el trato que establezcan las normas oficiales,
cules deberan ser esas normas? A menudo se describe el trato humano como
el tratamiento apropiado para los animales de laboratorio. Sin embargo las ratas
prefieren vivir en madrigueras oscuras hechas de basura y los humanos en
habitaciones limpias e iluminadasy as es precisamente como se tiene a las ratas
en los laboratorios. Quiz el trato humano que les damos no es precisamente el
que las ratas preferiran

Deben los seres humanos beneficiarse del uso de otros animales?

Muchos animales domsticos tambin se benefician de la relacin con los
humanos, de hecho algunos no existiran. Se trata de una relacin simbitica.

Adems el uso de animales de laboratorio representa tan slo una pequea parte
del uso que otros humanos hacen de los animales domsticos, incluyendo su uso
como fuente de alimentacin.

Dato curioso: En 1997 se utilizaron en EEUU 8,5 mil millones de animales en
alimentacin. Sin embargo solo se utilizaron 8,5 millones en laboratorio. Esto tan
slo constituye un 0,1% del nmero total de animales empleados en ganadera.

Si a estos datos sumamos el impacto en su habitat que tiene la construccin de
carreteras, viviendas, etc o los miles de animales muertos por insecticidas, etc. La
proporcin de los utilizados en laboratorios es an ms insignificante.

Alternativas a la investigacin con animales

Russell y Burch (1959) formularon las 3 R de la investigacin con animales.

- Reemplazamiento del uso de animales por otras tcnicas de estudio
- Reduccin del nmero de animales empleados por medio de tcnicas estadsticas
- Refinamiento de los procesos experimentales para causar menos sufrimiento
Algunas de las alternativas propuestas son las siguientes:

1. Tcnicas observacionales: No se puede. Los estudios de aprendizaje requieren
manipulaciones experimentales de la experiencia pasada.
2. Uso de plantas: No se puede estudiar el aprendizaje ya que carecen de sistema
nervioso.
3. Cultivo de tejidos: El funcionamiento de estos procesos celulares en el organismo
intacto solo puede estudiarse en el organismo intacto.
4. Simulaciones informticas: La preparacin de un programa informtico que simule
un fenmeno natural requiere un conocimiento profundo del fenmeno en
cuestin. No pueden utilizarse para generar hechos anteriormente desconocidos
sobre la conducta. Eso slo puede hacerse estudiando a los organismos vivos.

Principios de Aprendizaje y conducta
CAPITULO 1: INTRODUCCIN

Conn y parker (1998):

los cientficos dependen de los ordenadores para procesar los datos que ya poseen,
pero no pueden usarlos para explorar lo desconocido en busca de nueva informacin


TRMINOS CLAVE

Aprendizaje: Cambio duradero en los mecanismos de conducta que implica estmulos
y/o respuestas especficos y que es resultado de la experiencia previa con esos
estmulos y respuestas o con otros similares.

Asociacin: Conexin entre la representacin mental de dos eventos (dos estmulos o
un estmulo y una respuesta) de forma que la ocurrencia de uno de los eventos activa la
representacin del otro.

Dualismo: Visin de la conducta segn la cual las acciones pueden dividirse en dos
categoras: conducta voluntaria controlada por la mente y conducta involuntaria
controlada por mecanismos reflejos.

Ejecucin: Actividades de un organismo en un momento particular.
Empirismo: Corriente filosfica segn la cual todas las ideas de la mente tienen su
origen en la experiencia.

Fatiga: Disminucin temporal de la conducta provocada por el uso excesivo o repetido
de los msculos involucrados en ella.

Hedonismo: Postura filosfica propuesta por Hobbes segn la cual las acciones de un
organismo estn enteramente determinadas por la persecucin del placer y la evitacin
del dolor.

Maduracin: Cambio en la conducta causado por el desarrollo fsico o fisiolgico del
organismo en ausencia de experiencia con eventos particulares del ambiente.

Innatismo: Postura filosfica segn la cual los seres humanos nacen con ideas innatas.

Nervismo: Postura filosfica adoptada por Pavlov segn la cual todos los procesos
conductuales y fisiolgicos estn regulados por el sistema nervioso.

Reflejo: Mecanismo que permite que un evento especfico del ambiente elicite una
respuesta especfica.

Slaba sin sentido: Combinacin de 3 letras ( dos consonantes separadas por una
vocal) sin significado.

Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN


A) LA NATURALEZA DE LA CONDUCTA ELICITADA

Gran parte de la conducta de los animales tiene lugar como respuesta a estmulos,
es decir, ocurre de forma elicitada.

El concepto de reflejo

Un soplo de aire dirigido a la crnea provoca un parpadeo. Esto es un reflejo.

Un reflejo se compone de dos elementos, un estmulo elicitante y su correspondiente
respuesta. Estos dos elementos se comprenden bien mediante la organizacin del
sistema nervioso. En los vertebrados los reflejos simples estn mediados por 3
neuronas:

Neurona sensorial (aferente): capta el estimulo ambiental y transmite el mensaje a
la medula espinal.

Neurona motora (eferente): Activa el msculo involucrado en la respuesta refleja.

Interneurona: Neurona encargada de transmitir los impulsos entre los dos tipos de
neuronas anteriores.

Arco reflejo: Es el conjunto formado por la neurona sensorial, la interneurona y la
neurona motora. En los vertebrados, el arco reflejo representa el numero mnimo de
conexiones neuronales necesarias para que tenga lugar el acto reflejo.

La mayor parte de los reflejos contribuyen al bienestar del organismo. Si pongo la
mano en el fuego la quitar rpidamente, de lo contrario me quedara sin mano, algo
malo para el organismo.

Un reflejo importante en los recin nacidos es el reflejo de oclusin respiratoria: si
algo (prendas, mucosidades) tapona la nariz del beb, su reflejo ser echar la cabeza
hacia atrs buscando aire, si sigue sin encontrar aire comenzar a llorar, lo que
provocar una expulsin vigorosa del aire eliminando cualquier obstruccin de las vias
respiratorias. Esto es especialmente importante cuando le deis (me refiero a las
mujeres) de mamar a vuestro beb, ya que al no poder respirar por la boca (ya que
est ocupada por el pezn) tendr que respirar por la nariz y el resto del pecho no
debe taponarla, de lo contrario empezar a llorar, no querr comer y no sabris
porqu. Los consejos son gratis.






Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Pautas de accin modal

Las pautas de accin modal (PAMs) son respuestas tpicas de especies particulares.
Como ejemplo tenemos la respuesta de succin en mamferos a la hora de buscar
alimento. El libro pone ms ejemplos pero no los considero importantes y si los
pusiera todos esto no sera un resumen. Con captar la idea es suficiente.

Una de las caractersticas de las PAMs es que el umbral de estimulacin necesario
para que stas se pongan en marcha vara en funcin de las circunstancias. El
estmulo puede tener efectos diversos dependiendo del estado fisiolgico del animal y
de las acciones que haya realizado recientemente. Un pez espinoso no mostrar su
respuesta sexual hasta que la hembra no haya terminado de construir el nido. De la
misma manera que no nos lanzamos ante una persona del sexo opuesto en una
primera cita, aunque el impulso inicial sea exactamente ese.

Las PAMs fueron originariamente identificadas por los etlogos, cientficos
interesados en la evolucin del comportamiento. Inicialmente eran conocidas como
pautas de accin fija pero posteriormente se pens que eran ms bien variables, por
lo que se acept el trmino pautas de accin modal.

Estimulos elicitantes de las pautas de accin modal

Un estmulo elicitante se identifica fcilmente cuando se trata de reflejos simples, ante
un ruido mostraremos una respuesta de sobresalto. En cambio los estimulos
elicitantes de las PAMs son ms complejos.

Como ejemplo hablaremos de la alimentacin de la gaviota. Las crias picotean un
punto rojo en el pico de su progenitor, lo cual hace que regurgite la comida para ellos.
Ahora bien, qu es lo que provoca que las crias hagan este picoteo?? El color?? La
forma?? La longitud del pico de sus progenitores??

Para hallar la solucin a este problema hicieron experimentos y concluyeron que un
objeto alargado (en forma de pico) apuntando hacia abajo y con un punto rojo, era lo
que ms elicitaba la conducta de los polluelos, es decir, lo que provocaba un picoteo
ms fuerte por parte de ellos. Los rasgos especficos que se requieren para elicitar la
conducta de picoteo reciben colectivamente el nombre de estimulo seal o estimulo
desencadenante.

Un estmulo seal o desencadenante es suficiente para elicitar una pauta de accin
modal, sin embargo una determinada pauta de accin puede estar controlada por
varios rasgos del estmulo de forma aditiva. Adems el estmulo que elicita con mayor
efectividad la pauta de accin no tiene porqu ser el que ocurra con mayor
probabilidad en condiciones naturales.

Me da en la nariz que este ltimo prrafo es importante.

Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Estimulos supranormales: Son estmulos inusualmente efectivos. Aqu volvieron a
estudiar a las gaviotas, en concreto cuales eran los huevos que ms protegan.
Huevos verdes, grandes y moteados eran sus preferidos. Entonces los cientficos
crearon un super huevo verde artificial y lleno de motas que era mucho ms efectivo
que el natural a la hora de elicitar la respuesta de accin.

La organizacin secuencial de la conducta

Las respuestas no tienen lugar aisladas unas de otras sino que se organizan en
secuencias de comportamiento funcionalmente efectivas. Para obtener comida una
ardilla tiene que subir al arbol, alcanzar un fruto, romperlo, etc. Toda conducta dirigida
a metas involucra secuencias de acciones sistemticamente organizadas.

Los etlogos denominaron conducta apetitiva a los primeros componentes de la
secuencia del comportamiento y conducta consumatoria a los ultimos.

Las conductas apetitivas son menos estereotipadas y dependen del entorno(una
ardilla puede buscar comida de muchas formas, puede subir desde un arbol o saltar
desde otro cercano) sin embargo las conductas consumatorias son especificas de
cada especie y mucho ms estereotipadas (roer, masticar, tragar).

Pasando a los seres humanos, dependiendo de la etnia cocinamos la comida de
forma diferente (conducta apetitiva) pero todos masticamos y tragamos de la misma
forma (conducta consumatoria). Lo de masticar y tragar de la misma forma es
cuestionable

Secuencia de respuestas de bsqueda de comida con el ejemplo de la ardilla.

Modo de bsqueda general: Antes de que la ardilla pueda identificar un nogal se
mover buscando posibles fuentes de alimentacin.
Modo de bsqueda focalizada: Al encontrar un nogal pasar al modo focalizado en
el que slo buscar nueces en ese rbol.
Modo de manipulacin de alimento (o consumatorio): Obtener la nuez y
masticarla.

B) EFECTOS DE LA ESTIMULACIN REPETIDA

Descartes pensaba que una respuesta elicitada ocurre automticamente siempre
que se presentara el mismo estmulo elicitante. Falso. Si esto fuera verdad un beb
chupara siempre con la misma intensidad al presentarse un pezn. Por lo tanto la
respuesta puede variar, y aqu es donde nos encontramos con uno de los rasgos
ms caractersticos de la conducta elicitada: su plasticidad. Y aqu es donde
entendemos el ttulo de este apartado: La conducta elicitada puede variar como
resultado nicamente de la presentacin repetida del estmulo elicitante.


Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Atencin visual en los bebes humanos

Aqu se habla de un experimento en bebs que visualizaban varios tableros de
ajedrez y su respuesta de atencin visual variaba dependiendo de la naturaleza del
estmulo (haba tableros de 4x4 y tableros de 12x12) y de la repeticin del mismo.

Conclusin: La atencin visual provocada por un estmulo novedoso cambia a
medida que el beb se familiariza con el estmulo.

Con un patrn 4x4 relativamente sencillo, la atencin visual se reduce
progresivamente. Con un patrn 12x12 ms complejo, la atencin se incremente
inicialmente y despus se reduce.

Salivacin y evaluacin del sabor en humanos

El sabor de la comida elicita la salivacin como respuesta refleja. En un estudio se
midi la respuesta de salivacin de 8 mujeres ante el sabor del zumo de limn y el
zumo de lima. La salivacin como respuesta al sabor disminua con cada ensayo,
pero despus de 10 ensayos con limn, se introduca lima en el ensayo 11 y los
sujetos volvan a salibar de nuevo.

Conclusin: (atencin a esto que me parece bastante interesante)
Los resultados indican que las personas encuentran el sabor de una comida
especfica menos placentera cuanto ms la comen. Estos hallazgos sugieren que la
sobrealimentacin puede reducirse no variando los alimentos disponibles para su
consumo.

Respuesta de sobresalto en ratas

La respuesta de sobresalto se da en muchas especies, incluida la humana. Consiste
en un salto repentino y una contraccin de los msculos de la parte superior del
cuello. En las ratas puede medirse esta respuesta mediante la cmara estabilimtrica
que mediante sensores mide la intensidad de la reaccin de sobresalto.

Se meta a las ratas en la cmara y mediante sonidos y luces se les daba sustos para
medir su respuesta de sobresalto.

Conclusin: Las repeticiones de los sustos generaban cada vez respuestas ms
dbiles de sobresalto por parte de las ratas. (quiz porque las estaban matando poco
a pocoes broma, esto es cosa mia) . Por el contrario cuando el sonido era ms
intenso, las repeticiones de tono provocaron reacciones de sobresalto cada vez ms
vigorosas.




Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN


C) LOS CONCEPTOS DE HABITUACIN Y SENSIBILIZACIN

Efecto de habituacin: Disminucin de la tendencia a responder producido por la
estimulacin repetida.

Efecto de sensibilizacin: Incremento en la tendencia a responder producido por
la estimulacin repetida.

Adaptabilidad y generalidad de la habituacin y sensibilizacin

En nuestro da a da estamos bombardeados por multitud de estmulos, olores,
imgenes, texturas, etc. Los efectos de habituacin y sensibilizacin nos ayudan a
decidir qu estmulos ignorar y a cules responder, de lo contrario nuestra conducta
sera desorganizada y catica.

Ejemplo: Hace dos aos que me compr una vivienda en una urbanizacin, mi bloque
en concreto da a una carretera bastante transitada. Al principio me cost
acostumbrarme a dormir por las noches, hoy en da ni siquiera oigo los coches.
Seguro que todos tenemos mltiples ejemplos sobre este tema. El libro pone ms
ejemplos pero creo que el concepto est bastante claro.

Diferencias entre habituacin, adaptacin sensorial y fatiga

La habituacin no es el nico efecto que da lugar a una disminucin en la respuesta.

Un reflejo tambin puede provocar una disminucin en la respuesta.

Recordemos que el reflejo consta de 3 componentes:

- Un estmulo que activa los rganos sensoriales
- Interneuronas que transmiten los mensajes sensoriales a los rganos motores
- Impulsos nerviosos que activan los msculos

Sin embargo, a pesar de todo esto, puede no darse una respuesta si por alguna razn
los rganos sensoriales pierden temporalmente sensibilidad a la estimulacin. Una
persona puede quedar temporalmente cegada por una luz brillante (adaptacin
sensorial) y una respuesta tampoco tendr lugar si los msculos involucrados
quedan incapacitados por la fatiga.

- La adaptacin sensorial ocurre en los rganos sensoriales
- La fatiga de la respuesta tiene lugar en los msculos efectores
- La habituacin y sensibilizacin tienen lugar en el sistema nervioso



Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN


Cmo distinguimos todo esto?

- La habituacin se distingue de la adaptacin sensorial en que la habituacin es
especfica de la respuesta. Si el profesor da un aviso en medio del examen
levantamos la vista por un momento pero luego la bajamos y podemos seguir
escuchando lo que dice.

- La habituacin se distingue de la fatiga en que la habituacin es especfica del
estmulo. Esto se explica con el ejemplo de la salivacin y el limn, cuanto ms
nos exponemos al limn, menos salibamos y menos notamos su sabor, pero si
de repente nos introducen lima volvemos a recuperar la respuesta. La prdida
de respuesta no vena condicionada por la fatiga.

Teora del proceso dual de habituacin y sensibilizacin

Y me da a mi que aqu se empieza a poner la cosa suave

Esta teora fue formulada por Groves y Thompson (1970). La teora del proceso dual
presupone que los incrementos y disminuciones en la tendencia a responder a un
estmulo son producto de procesos neurales diferentes. El proceso de habituacin
provoca una disminucin en la tendencia a responder, en cambio, el proceso de
sensibilizacin produce un incremento en la tendencia a responder.

Sin embargo ambos procesos estn relacionados y pueden estar activos al mismo
tiempo ante un mismo estmulo.














Linea Verde: Sensibilizacin
Linea Roja: Habituacin
Linea Negra: NETO (resultado entre la verde y la roja)
Linea Azul: Ni caso, es el eje 0

Cambio en
la magnitud
de la
respuesta
Ensayos
+
-
0

Ensayos
+
-
0
Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Podemos observar que en el panel izquierdo una repeticin hipottica del estmulo
intensifica el proceso de habituacin (la lnea roja). Decimos que lo intensifica porque
el Neto est ms cerca de la lnea roja. En el panel de la derecha ocurre lo contrario,
el neto est mas cerca de la lnea verde, lo cual indica que intensifica el proceso de
sensibilizacin.

Aqu es importante sealar que un aumento (sensibilizacin) o disminucin
(habituacin) de la respuesta, viene dado por la suma resultado de los procesos de
sensibilizacin y habituacin juntos. No caigamos en el error de pensar que la
sensibilizacin viene dada nicamente por el proceso de sensibilizacin, ya que el
proceso de habituacin tambin tiene su funcin.

Groves y Thomson sugirieron que los procesos de habitacin y sensibilizacin tienen
lugar en diferentes partes del sistema nervioso:

- Proceso de habituacin: tiene lugar en el sistema E-R (estimulo respuesta)
- Proceso de sensibilizacin: tiene lugar en el sistema de estado. Este
sistema abarca otras partes del sistema nervioso que determinan el nivel
general de disposicin a responder. Las drogas pueden alterar la tendencia a
responder.

Implicaciones de la teora del proceso dual

- El sistema E-R se activa siempre que un estmulo elicita una respuesta ya que
es el circuito neuronal que lleva los impulsos desde la entrada sensorial hasta
la salida conductual.
- El sistema de estado slo interviene en circunstancias especiales. Algunos
eventos externos (como un ruido intenso) pueden incrementar el estado de
alerta del individuo y sensibilizar el sistema de estado.

La teora del proceso dual de habituacin y sensibilizacin ha tenido una gran
influencia en el estudio de la plasticidad de la conducta elicitada.

Pues s, tena razn, todo esto del proceso dual ha sido bastante suave


D) CARACTERSTICAS DE LA HABITUACIN Y SENSIBILIZACIN

1. Curso temporal

La mayor parte de los cambios conductuales se mantiene durante perodos largos.

Curso temporal de sensibilizacin

Por lo general los procesos de sensibilizacin tienen efectos temporales. En todos los
sistemas de respuesta la duracin de los efectos de sensibilizacin est determinada
Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

por la intensidad del estimulo. Los estmulos ms intensos producen mayores
incrementos de la tendencia a responder y una sensibilizacin ms persistente.

Curso temporal de la habituacin

2 tipos de efectos de habituacin cualitativamente distintos:

- La habituacin a corto plazo (desaparece en segundos o minutos)
- La habituacin a largo plazo (persiste durante muchos das)

Aqu es importante quedarnos con el concepto de:

Recuperacin instantnea: Recuperacin de una respuesta habituada o de una
respuesta extinguida tras un perodo de descanso. La recuperacin instantnea es la
caracterstica principal del efecto de habituacin a corto plazo.

La habituacin a corto plazo suele tener lugar cuando el estmulo elicitante se
presenta frecuentemente. Por el contrario, la habituacin a largo plazo es ms
probable cuando las presentaciones del estmulo estn ms separadas.

2. Especificidad del estimulo

Especificidad del estimulo en la habituacin

La habituacin es especfica del estmulo que ha sido presentado repetidamente. Una
respuesta a un estmulo previamente habituada puede manifestarse plenamente
alterando alguna caracterstica importante del estmulo. (si nos acostumbramos al
sonido de un reloj que tengamos por casa poco a poco dejamos de oirlo, pero si de
repente notamos que se rompe y hace un ruido diferente es probable que volvamos a
prestar atencin.)

Generalizacin del estmulo de habituacin: Seguimos con el ejemplo del reloj. Si nos
habituamos a su sonido y nos presentan otro reloj diferente pero con un sonido
similar, es posible que tampoco lo oigamos.

Especificidad del estimulo de sensibilizacin

La sensibilizacin no es muy especfica del estmulo. Si un animal se activa o
sensibiliza por alguna razn, su reactividad se incrementar para toda una variedad
de estmulos, no slo para el causante de su sensibilizacin.






Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

3. Efecto de un estmulo externo intenso

Deshabituacin: Una respuesta habituada puede restablecerse sensibilizando al
organismo con la exposicin a un estmulo externo. Es importante tener en cuenta
que la deshabituacin hace referencia a la recuperacin de la respuesta al estmulo
previamente habituado. Con el ejemplo del ajedrez y los nios, cuando les habian
mostrado el ajedrez 8 veces y ya prcticamente no le prestaban atencin, de repente
en la vez 9 se lo mostraron acompaado de un sonido. Esto les hizo recuperar parte
de la atencin en la vez 10 y 11.

E) APLICACIN A LAS EMOCIONES Y LA CONDUCTA MOTIVADA

Hasta ahora se ha hablado de cambios en la conducta con respuestas sencillas,
ahora veremos las ms complicadas como el miedo, euforia, terror, etc.

Reacciones emocionales y sus efectos posteriores

Solomon y Corbit destacaron que las reacciones emocionales intensas a menudo
constan de dos fases. Una emocin tiene lugar durante la presentacin del estmulo
elicitante y la opuesta se observa cuando el estmulo desaparece. (efecto sedante,
relajante y agradable del alcohol al principio, en contraposicin al dolor de cabeza y
nausea de la resaca).

Otra caracterstica de las reacciones emocionales es que cambian con la experiencia.
La reaccin primaria se hace ms dbil y su postefecto se hace ms fuerte. (un
bebedor habitual no queda tan debilitado por pocas cervezas pero sin embargo tendr
sntomas ms agudos tras beber) Puede tener resacas ms severas irritabilidad e
incluso sufrir agitaciones alucinaciones o incluso delirius tremens. (Para quien le guste
el cine, dos grandes pelculas de alcohlicos son Das sin Huella (Billy Wilder) y
Leaving Las Vegas protagonizada por Nicholas Cage En ambas pelculas podemos
observar los estragos que hace el delirius tremens)

Tolerancia a la droga: Habituacin de la primera reaccin a la droga

Tambin podemos encontrar esta misma analoga de dos procesos en el amor y el
apego. Las parejas con el tiempo dejan de darse los signos de amor del principio e
incluso dejan de sentir ese enamoramiento principal, debido a la habituacin. Sin
embargo cuanto ms tiempo lleve una pareja junta, ms difcil ser la perdida de uno
de ellos para el otro.






Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

La teora del proceso oponente

Esta teora se dise para explicar los 3 rasgos caractersticos de las emociones. (los
vuelvo a poner a continuacin pero bsicamente se han explicado a lo largo del punto
anterior)

1. Las reacciones emocionales son bifsicas; a una reaccin primaria sigue un
postefecto opuesto.
2. La reaccin primaria de debilita con la estimulacin repetida.
3. El debilitamiento de la reaccin primaria va acompaado de un fortalecimiento
del postefecto.

La teora asume que los mecanismos neurofisiolgicos involucrados en la conducta
emocional tratan de mantener la estabilidad emocional, se trata de minimizar las
desviaciones intentando volver a la neutralidad de nuestro estado emocional. Por esta
razn decimos que es una teora homeosttica.

La teora asume que un estmulo emocional activador desva de la neutralidad el
estado emocional de una persona. Se asume que este desplazamiento con respecto a
la neutralidad emocional pone en marcha un proceso oponente (contrario) que
compensa el cambio). Me pongo sper contento con el alcoholmi mecanismo
neurofisiolgico detecta que esto no es normal y me provoca una resaca de cojones
para volver a mi estado normal.

Y segn esto y siguiendo con la teora

Encontramos dos tipos de procesos:

Proceso primario o proceso a: Es el responsable de la naturaleza del estado
emocional que tiene lugar en presencia del estmulo (la alegra).

Proceso oponente o proceso b: Es el que genera la reaccin emocional opuesta
(por ejemplo tristeza). Ms que con la resaca quiz esto tenga ms relacin con el
bajn emocional que algunas personas sufren al da siguiente de haber tenido una
borrachera. El proceso oponente es ligeramente ineficiente ya que no logra
contrarrestar del todo al proceso primario. Sin embargo con la repeticin logramos
una sensibilizacin de este proceso y por lo tanto un mayor efecto. (lo que hemos
hablado antes de resacas ms fuertes en bebedores habituales).

Los dos mecanismos que vienen a continuacin son un cacao de narices a primera
vista (por lo menos para mi) pero tras unos minutos analizando los grficos de la
pgina 54 y 55 del libro no son tan difciles. En la siguiente hoja doy una pequea
ayuda sobre cmo leer esos grficos.




Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Mecanismos oponentes durante la exposicin inicial al estmulo

En la primera presentacin del estmulo el proceso b no es lo suficientemente fuerte
para compensar por completo la respuesta emocional primaria, que persiste mientras
est presente el estmulo elicitante. Cuando el estmulo se retira, el proceso a se
detiene rpidamente pero el proceso b permanece por algn tiempo y se hace
evidente por primera vez.

Mecanismos oponentes tras la exposicin prolongada al estmulo

El proceso b se fortalece con la exposicin prolongada al estmulo, por el contrario se
asume que el proceso a permanece inalterado. Por tanto, tras la presentacin
repetida de un estmulo, la respuesta emocional primaria queda compensada de
forma ms efectiva por el proceso oponente.

Ayuda para comprender los grficos: La parte de arriba del grfico es la conducta
observable de la persona, y la parte de bajo son los mecanismos oponentes que
estn por debajo de la conducta y no se ven. Si lo viramos desde el punto de vista
matemtico, la parte de arriba es el resultado (es lo que vemos) mientras que la parte
de bajo es la suma y la resta (que no observamos) pero que dan lugar al resultado. Si
miris las lneas, realmente parece que las dos lneas de bajo (a y b) dan como
resultado la lnea superior (a-b). Espero haberos ayudadohe sido lo ms explcito
posible.


Motivacin y postefecto oponente

Si los consumidores habituales de drogas cada vez notan menos placer al
consumirlas porqu se hacen adictos? La teora del proceso oponente sugiere que la
adiccin a las drogas es un intento de reducir la aversin producida por el postefecto
afectivo de las drogas (bajn, irritabilidad, malestar). Hay dos formas de reducir el
postefecto, una es simplemente esperar a que pase el efecto oponente (pasar el
mono) pero muchas veces el mono es tan largo que la otra forma de pasarlo es volver
a consumir la droga. Este mecanismo es lo que hace que la gente se haga adicta, no
por el placer directo que obtienen de la droga, sino para reducir los efectos de
retirada.


Valoracin general de la teora del proceso oponente

Esta teora no ha conseguido explicar tantas cosas como prometa. Lo ms
destacable es que ha supuesto una importante contribucin al aplicar el concepto de
regulacin homeosttica al anlisis de las emociones y la motivacin.



Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Variaciones en la conducta dirigida a metas

Responder para escapar de la molestia producida por la retirada de un estmulo es
solo uno de los tipos de conducta motivada o dirigida a metas. En los siguientes
temas veremos ms ejemplos de este tipo de conductas, prestando especial atencin
a las situaciones en las que los individuos dan una respuesta para alcanzar un
estmulo gratificante. Este objeto meta recibe el nombre de reforzador.

TRMINOS CLAVE

Adaptacin sensorial: Reduccin temporal en la sensibilidad de los rganos
sensoriales provocada por la estimulacin repetida o excesiva.

Arco reflejo: Estructura neural que consiste en una neurona aferente (sensorial), una
interneurona y una neurona eferente (motora) y que permite que un estmulo pueda
elicitar una respuesta refleja.

Conducta apetitiva: Conducta que tiene lugar al principio de una secuencia natural
de conducta y que sirve para poner al organismo en contacto con un estmulo
desencadenante.

Conducta consumatoria: Conducta que lleva a consumar o completar una secuencia
natural de conducta. Las respuestas consumatorias son, por lo general, patrones de
accin modal especficos de la especie.

Deshabituacin: Recuperacin de una respuesta habituada como resultado de la
presentacin de un estmulo externo e intenso.

Efecto de habituacin: Disminucin progresiva en el vigor de la conducta elicitada
que puede tener lugar con la presentacin repetida del estmulo elicitante.

Efecto de sensibilizacin: Incremento en el vigor de la conducta elicitada que puede
resultar de la presentacin repetida del estmulo elicitante o de la exposicin a un
estmulo externo intenso.

Estmulo desencadenante: Lo mismo que estmulo seal

Estmulo seal: Rasgo especfico de un objeto o animal que elicita una pauta de
accin modal en otros organismos. Tambin llamado estmulo desencadenante.

Estmulo supranormal: Estmulo seal artificialmente agrandado o exagerado que
elicita una respuesta inusualmente vigorosa.

Fatiga: Disminuacin temporal de la conducta causada por el uso repetido o excesivo
de los msculos involucrados en la conducta.

Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Interneurona: Neurona de la mdula espinal situada entre la neurona aferente (o
sensorial) y la neurona eferente (o motora) en el arco reflejo.

Modo de bsqueda focalizada: Segundo componente de la secuencia de conducta
de alimentacin, tras la bsqueda general, en el que el organismo pone en marcha
una conducta centrada en la localizacin de un estmulo particular que indica la
presencia de alimento. La bsqueda focalizada es una forma de conducta apetitiva
ms directamente relacionada con el alimento que la bsqueda general.

Modo de bsqueda general: Primer componente de la secuencia de conducta de
alimentacin, en la que el organismo pone en marcha una conducta motora sin
direccin fija. La bsqueda general es una forma de conducta apetitiva.

Modo de manipulacin del alimento: ltimo componente de la secuencia de
conducta de alimentacin en el que el organismo manipula y consume el alimento. Es
similar a lo que los etlogos llaman conducta consumatoria

Neurona aferente: Neurona que transmite mensajes de los rganos de los sentidos
al sistema nervioso central. Tambin recibe el nombre de neurona sensorial.

Neurona eferente: Neurona que transmite los impulsos a los msculos. Tambin
llamada neurona motora.

Neurona motora: Lo mismo que neurona eferente.

Neurona sensorial: Lo mismo que neurona aferente.

PAM: Abreviatura de pauta de accin modal.

Pauta de accin modal: Patrn de la respuesta exhibido de forma similar por la
mayora de los miembros de una misma especie. Las pautas de accin modales
utilizan como unidades bsicas de conducta en las investigaciones etolgicas del
comportamiento.

Proceso a: Lo mismo que proceso primario en la teora del proceso oponente de la
motivacin.

Proceso b: Lo mismo que proceso oponente en la teora del proceso oponente de la
motivacin.

Proceso de habituacin: Mecanismo neural activado por la repeticin de un estmulo
que reduce la magnitud de las respuestas elicitadas por ese estmulo.

Proceso de sensibilizacin: Mecanismo neural que incrementa la magnitud de las
respuestas elicitadas por un estmulo.

Principios de Aprendizaje y conducta
CAPITULO 2: CONDUCTA ELICITADA HABITUACIN Y SENSIBILIZACIN

Proceso oponente: Mecanismo compensatorio que tiene lugar en respuesta al
proceso primario elicitado por eventos biolgicamente significativos. El proceso
oponente provoca cambios fisiolgicos y conductuales opuestos a los que provoca el
proceso primario.

Proceso primario: Primer proceso elicitado por un evento biolgicamente
significativo.

Recuperacin espontnea: Recuperacin de una respuesta habituada o de una
respuesta extinguida tras un perodo de descanso.

Reforzador: Estmulo cuya administracin inmediatamente posterior a una respuesta
incrementa la probabilidad futura de dicha respuesta.

Sistema de estado: Estructuras neurales que determinan el nivel general de
responsividad o tendencia a responder del organismo.

Sistema E-R: Ruta neural ms corta que conecta los rganos sensoriales
estimulados por un estmulo elicitante con los msculos involucrados en la produccin
de la respuesta elicitada.

Tolerancia a la droga: Reduccin en la efectividad de una droga como resultado del
uso repetido de la droga.

Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

A) LOS PRIMEROS AOS DEL CONDICIONAMIENTO CLSICO

Los primeros estudios comenzaron con el trabajo de Pavlov.
Otro cientfico llamado Edwin B. Twitmyer tambin lo descubri de manera independiente a
Pavlov.

Los estudios de Pavlov sobre el condicionamiento clsico fueron una extensin de su
investigacin sobre el proceso de digestin. Experimentaba mucho con perros. Los tcnicos de
su laboratorio pronto descubrieron que los perros secretaban jugos gstricos en respuesta a la
mera visin de la comida o de la persona que los alimentaba. Llamaron a estos jugos
secreciones psquicas

Los descubrimientos de Vulfson y Snarskii

Fueron los primeros en estudiar el condicionamiento clsico en el laboratorio de Pavlov.
Siguieron experimentando con los perros y su salivacin.

Estmulos orofaringeos: Algunas sustancias provocan en la boca sensaciones de textura
y sabor caractersticas. Estas sensaciones reciben el nombre de estmulos orofaringeos.

Los perros salivaban cuando se les pona arena en la boca, posteriormente la sola visin de la
arena les haca salivar. Este tipo de aprendizaje se denomina aprendizaje de objeto ya que
requiere asociar diferentes caractersticas de un mismo objeto.

El paradigma de condicionamiento clsico

El procedimiento de Pavlov constaba de dos estmulos:

-Luz que no provoca salivacin al principio del experimento. Se trata del estmulo condicional
ya que su efectividad depende de su emparejamiento con el cido. Provoca una respuesta
condicional

-Solucin cida situada en la boca. Se trata del estmulo incondicional ya que no depende de
nada para producir saliva. Provoca una respuesta incondicional.


B) LOS PRIMEROS AOS DEL CONDICIONAMIENTO CLSICO

Condicionamiento del miedo

Watson y Rainer (1920). Pensaban que los nios estaban muy limitados para dar respuestas
emocionales distintas. Se dieron cuenta que mediante el condicionamiento clsico podan
despertar este abanico de emociones. Y no tuvieron mejor cosa que hacer que condicionar la
respuesta de miedo a un nio de 9 meses ante la presentacin de una rata blanca. Le ponan
la rata delante y hacan sonar justo detrs de su cabeza una barra de hierro muy fuerte y se
asustaba, al poco tiempo la sola presencia de la rata hacia que se asustase. Este miedo se
generaliz a otros objetos peludos como un conejo, un abrigo de piel o un mascara de santa
Claus.

Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

Ms tarde se dieron cuenta que quiz no era tan buena idea estudiar el condicionamiento del
miedo en seres humanos, probablemente por los graves trastornos psicolgicos que sufriran
los pacientes. Entonces comenzaron a utilizar ratas y descargas elctricas en las patas como
estmulo incondicional aversivo.

Ante una descarga elctrica la rata se paraliza por el miedo. Sin embargo para medir la
respuesta de miedo utilizaban la tcnica REC (respuesta emocional condicionada).

Para explicar en qu consiste el REC en un experimento concreto con ratas, el libro lo hace un
poco lioso desde mi punto de vista. Lo explicar por puntos porque es muy fcil:

1. Se ensea a las ratas a presionar una palanca para obtener comida
2. Se muestra un EC (estimulo condicionado) que puede ser una luz o un pitido seguido de
una descarga elctrica.
3. La rata se paraliza y no puede acceder a la palanca.
4. Finalmente la sola presencia del EC (sin la descarga) hace que la rata se paralice.

Para ponerle nmeros a todo esto se calcula algo llamado Razn de supresin


Razn de supresin = Respuestas durante EC

(Respuestas durante EC + Respuestas durante Pre EC)


Entendiendo por respuestas el nmero de presiones de la palanca. Cuanto menor es la razn
de supresin, menor es la respuesta del animal. Entendiendo por razn de supresin = 0 una
parlisis total de su respuesta.

Aparte del experimento de la palanca tambin utilizaban la supresin condicionada del
lameteo en el cual ratas sedientas beban de un tubo que desprenda agua y mediante el EC
se paralizaban y no beban.

Condicionamiento del parpadeo

Conocido como reflejo palpebral.

1. Presentacin de un estmulo condicionado Tono
2. Soplo de aire a los ojos estmulo incondicionado Se produce el parpadeo.
3. El sujeto aprende a parpadear ante la sola presencia del estmulo condicionado

Ejemplo con nios de 5 meses. Se crearon 2 grupos. En un primer grupo hubo un tono seguido
de un soplo de aire. En el segundo grupo hubo mayor intervalo de tiempo entre el tono y el
soplo de aire, por lo tanto ambos estmulos no quedaban emparejados.

Conclusiones:

a) Para que se produzca condicionamiento clsico debe haber emparejamiento entre EC y
EI.
b) b) El aprendizaje inicial puede no ser directamente observable.

Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

Recuadro 3.2 El condicionamiento palpebral y la bsqueda del engrama

Aviso a navegantes: Debido al carcter explicativo y ejemplificativo de los recuadros, es
realmente difcil resumir de la misma manera que el resto del texto, ya que todo parece
importante y existe una cantidad de datos por m
2
abrumadora. Asi que toca leerlos con calma.
De todas maneras intentar extraer los puntos esquemticos ms importantes.

Cuando un organismo aprende algo, la red de neuronas que almacena esta nueva informacin
se llama engrama.

Dnde se encuentra el engrama?

Richard Thompson ha buscado la respuesta durante casi 4 dcadas.

La bsqueda del engrama comenz por el hipocampo. Sin embargo comprobaron en animales
que si les extirpaban el hipocampo la capacidad de aprendizaje condicionado no se alteraba.

Entonces concluyeron que el engrama se encontraba en el cerebelo Y a partir de aqu todo
se complica y no queda ms remedio que echarle unos minutos para leer con tranquilidad la
pgina 68 mientras que al mismo tiempo se analiza el grfico de la 69.

Estmulo incondicionado La seal llega al cerebelo a travs de fibras trepadoras
Estmulo condicionado La seal llega al cerebelo a travs de fibras musgosas

Seguimiento del signo

Pavlov pensaba que el condicionamiento solo se daba en sistemas de respuesta reflejos, sin
embargo despus apareci el paradigma de seguimiento del signo o automoldeamiento que
explicaba cosas diferentes.

Los animales se aproximan a estmulos que sealan la disponibilidad de alimento. Un halcn
predice que puede alimentarse al ver el movimiento de un ratn.

Cmo comprobaban el seguimiento del signo en el laboratorio?

Con Palomas dentro de una caja. Haba una tecla (EC) que se iluminaba durante 8
segundos y a continuacin se administraba comida (EI) en un pequeo comedero (no era
necesario pulsar la tecla para administrar comida, ya que el procedimiento era automtico).
Sin embargo con las repeticiones, cada vez que la tecla se encenda, las palomas
picoteaban la tecla.

En otro experimento la tecla y la comida estaban bastante alejados, y la comida se
presentaba solo durante poco tiempo, por lo cual la paloma tena que ser rpida para poder
comer. Sin embargo cada vez que la tecla se encenda, la paloma corra a picotear la tecla
(totalmente innecesario) y luego corra hacia el comedero. Poda haberse quedado
esperando todo el tiempo delante del comedero sin necesidad de moverse de un lado para
otro, pero este experimento demuestra que tenan una atraccin irresistible a las seales
de comida condicionadas clsicamente, es decir, a la tecla (EC).



Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

Aprendizaje de aversin al sabor

El acto de comer proporciona numerosas oportunidades para el aprendizaje de asociacin.

La aversin a un sabor puede aprenderse si la ingestin de un sabor nuevo va seguida de
enfermedad o de otras circunstancias negativas. Por el contrario la preferencia por un
sabor va acompaada de sensaciones de saciedad u otras circunstancias positivas.

En el caso de aversin a un sabor por haber enfermado, lo curioso es que el 20% de los
casos las personas estaban seguras que su enfermedad no tena que ver con la comida, y
sin embargo le cogieron aversin. Esto demuestra que el aprendizaje de aversin al sabor
es independiente de los procesos racionales.

Como ejemplo se investig que pacientes con cancer desarrollaban aversin a comidas
que tomaban antes de una sesin de quimioterapia (estas sesiones suelen provocar
vmitos y malestar). Otros trastornos como la anorexia nerviosa o la depresin severa
pueden incrementar la capacidad de desarrollar aversin a la comida.

Para probar esto en animales se les daba una comida con sabor distintivo (EC) y a
continuacin se les inyectaba una droga (EI) que les provocaba malestar.

Caractersticas de la aversin al sabor

- Un nico emparejamiento entre EC y EI puede provocar la aversin (eso tambin
puede suceder con el aprendizaje del miedo). Sin embargo se necesitan ms
emparejamientos en el condicionamiento palpebral, el condicionamiento salival o el
seguimiento del signo.
- Se produce aversin aunque la enfermedad se presente horas despus de haber
comido. Es lo que se conoce como Aprendizaje demorado.

Ejemplo del aprendizaje demorado en ratas: Se les daba a beber agua con sacarina y
luego en diferentes grupos las sometan a radiacin en intervalos de tiempo distintos. El
grupo que se someti a radiacin 6 horas despus de beber desarroll mayor aversin al
agua que el grupo que se le dio radiacin 12 horas despus y este a su vez mayor
aversin que el grupo de las 24 horas.

C) PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO
EXCITATORIO

Aqu el libro explica que todos los procedimientos de aprendizaje del punto anterior son
ejemplos de condicionamiento pavloviano excitatorio. Y parece que este punto se va a centrar
en analizar las caractersticas comunes de todos ellos para establecer leyes generales sobre
este tipo de condicionamiento.








Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

Procedimientos tpicos de condicionamiento pavloviano

Es muy importante la ordenacin temporal del estmulo condicionado y el estmulo
incondicionado.

Intervalo entre ensayos: Tiempo entre el final de un ensayo de condicionamiento y el inicio
del siguiente.
Intervalo entre estmulos: Tiempo entre el EC y el IE.

Para que haya respuesta de condicionamiento, el intervalo entre estmulos debe ser mucho
menor que el intervalo entre ensayos.

5 procedimientos comunes de condicionamiento clsico
(no sigis leyendo sin mirar el grfico de la pgina 75 porque os ser muchsimo ms fcil de
entender)

1. Condicionamiento de demora corta: Se presenta el EC y al poco tiempo y sin que
haya finalizado, se presenta el EI.
2. Condicionamiento de huella: Se presenta el EC y cuando ha acabado se presenta el
EI. Al intervalo entre ambos se le llama intervalo de huella.
3. Condicionamiento de demora larga: Como el de demora corta pero el EC dura
mucho ms tiempo. Entonces se presenta el EI antes de que EC acabe.
4. Condicionamiento simultneo: EC y EI se presentan a la vez.
5. Condicionamiento hacia atrs: Al revs que todos los anteriores. Se presenta el EI y
luego el EC.

Medida de las respuestas condicionadas

Ensayo de prueba: Ensayo en el que se presenta el EC sin el EI. Esto permite medir la
respuesta condicionada en ausencia de la respuesta incondicionada. Son fundamentales en
para evaluar el aprendizaje en el condicionamiento simultneo y hacia atrs.

Magnitud: Cantidad de conducta que tiene lugar (por ejemplo el nmero de gotas de saliva
del perro de Pavlov)

Fuerza de la respuesta: Se mide por la frecuencia con la que el EC provoca una respuesta
condicionada. Muy relacionada con la probabilidad (cmo de probable es que el EC de una
respuesta condicionada)

Latencia: Cantidad de tiempo que pasa entre el principio del EC y la aparicin de la respuesta
condicionada.

Procedimientos de control en el condicionamiento clsico

En los primeros captulos veamos que los procedimientos de control de la habituacin y la
sensibilizacin eran muy simples ya que nicamente consistan en la ausencia de
exposicin al estmulo.

Sin embargo los procedimientos de control del condicionamiento clsico con ms
complicados ya que se produce una asociacin entre un EC y un EI y esto es ms
complejo de estudiar.
Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

Pseudocondicionamiento: Casos en los que la mera exposicin al Estmulo
Incondicionado da lugar a respuestas similares a la respuesta condicionada. Es algo as
como un falso condicionamiento. Si a un perro hambriento se le presenta comida (EI)
puede incrementar la conducta provocada por un estmulo menos efectivo como un tono
(EC), sin que se haya establecido ninguna asociacin entre los dos estmulos.

Para saber si se trata de un pseudocondicionamiento o realmente un condicionamiento
clsico (asociacin entre EC y EI) son necesarios los procedimientos de control.

Control aleatorio: Procedimiento en el que los estmulos condicionado e incondicionado
se presentan en momento aleatorios uno con respecto a otro. Sin embargo este tipo de
control puede dar lugar a aprendizaje asociativo.

Control desemparejado explcito: EC y EI se presentan lo suficientemente separados
para evitar que se asocien.


Eficacia de los procedimientos tpicos de condicionamiento

Trataban de averiguar cual de los 5 procedimientos de condicionamiento vistos en la hoja
anterior daba ms muestras de aprendizaje. Para ello lo primero que hay que tener en
cuenta es el intervalo entre estmulos o intervalo EC-EI.

- Simultaneo: Poco condicionamiento en el condicionamiento simultaneo en los que
el intervalo EC-EI es 0.
- Demora corta: facilita la respuesta condicionada
- Demora larga: Disminuye la respuesta condicionada
- De huella: Se genera un intervalo de huella. Al igual que en demora larga, cuanto
ms separados estn EC y EI, se produce menos condicionamiento.
- Hacia atrs: Ofrece resultados ambiguos. Se ha observado condicionamiento
excitatorio o inhibitorio.

Todo esto es de cajn, cuanto ms separados en el tiempo estn dos estmulos, menos
posibilidades hay de que yo los relacione, es decir, hay menos posibilidades de que se
produzca condicionamiento.

2 ideas que debemos recordar a modo de conclusin:

- El condicionamiento es ms efectivo cuando el EC es una buena seal de que el EI
aparecer pronto.
- Se produce mejor condicionamiento cuando el intervalo EC-EI es corto.

Hiptesis de codificacin temporal: El sujeto no slo aprende a relacionar EC y EI, sino
que dependiendo del procedimiento utilizado (de los 5 que hemos visto) tambin aprender
cando en el tiempo va a ocurrir EI. (esto se ver en profundidad en el tema 4)






Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

D) CONDICIONAMIENTO PAVLOVIANO INHIBITORIO

Este tipo de condicionamiento pretende predecir la ausencia del estmulo incondicionado.

Porqu nos interesa predecir la ausencia de algo?

Por ejemplo para los ataques de pnico. Est demostrado que las personas que saben cundo
van a tener uno de estos ataques, su nivel de ansiedad desciende despus de tenerlo. Por el
contrario los ataques imprevisibles hacen aumentar el nivel de ansiedad.

Estmulos condicionados inhibitorios: Seales que predicen la ausencia de un estmulo
aversivo.


Procedimientos de condicionamiento inhibitorio (con calma)

El condicionamiento excitatorio puede proceder sin condiciones previas especiales, sin
embargo para que se d el condicionamiento inhibitorio hay un requisito importante: el EI
debe ocurrir peridicamente en la situacin. Si vamos a una gasolinera esperamos
encontrar gasolina (EI) sin embargo si vemos el cartel No hay gasolina nos sentiremos
frustrados. En este ejemplo el cartel es una seal de condicionamiento inhibitorio.

Procedimiento estndar de inhibicin condicionada (grfico pg 82)

Este procedimiento consta de dos ensayos diferentes que se intercalan.

Ensayo A (condicionamiento excitatorio)

- Tenemos un EC+ y un EI. Es un ensayo de tipo excitatorio como los que vimos al
principio. El Estmulo incondicionado ocurre inmediatamente despus del estmulo
condicionado y de esta manera quedan asociados. (ponemos un signo positivo al
EC+ para diferenciarlo del estmulo inhibitorio (EC-) que vemos en el siguiente
ensayo)

Ensayo B (condicionamiento inhibitorio)

- A diferencia del ensayo A, aqu no se presenta el EI. Tan slo tenemos un EC+ y un
EC- que se presentar en el contexto excitatorio proporcionado por el EC+. Pero no
se empareja con el EI. Por lo tanto decimos que el EC- es un inhibidor
condicionado.

No nos confundamos al pensar que el procedimiento estndar de inhibicin condicionada
consta de dos tipos distintos de ensayo, sino que los dos ensayos forman parte del mismo
procedimiento. Es decir, el procedimiento siempre va a constar de dos fases, una fase
inicial en la que creamos un condicionamiento excitatorio y una segunda fase en la que
utilizamos el condicionamiento de la fase anterior para construir la inhibicin.





Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

Contingencia o correlacin negativa entre el EC y el EI (grfico pg 83)

Una contingencia o correlacin negativa indica que el EI es menos probable tras el EC que
en otro momento. En el grfico podemos observar que la presencia de EC predice la
ausencia del EI durante un tiempo.

En este tipo de procedimiento, el EI aversivo puede aparecer de vez en cuando tras el EC,
pero con una probabilidad pequea.

Medicin de la inhibicin condicionada

La inhibicin condicionada produce cambios en la conducta observable, pero Cmo
podemos observar estos cambios?

Hay 3 mtodos

A) Sistemas de respuestas bidireccionales

Se puede medir fcilmente en aquellos sistemas que tengan una lnea base. El ritmo
cardiaco o la respiracin nos permite saber si sus valores suben o bajan, o un animal que
se acerca o se aleja de un estmulo.

En estos casos la excitacin condicionada da lugar a un cambio conductual en una
direccin y la inhibicin condicionada la lugar a un cambio en la direccin opuesta.

Limitaciones
- Slo funciona con respuestas que pueden ir en direcciones opuestas.
- Slo muestra el efecto neto (resultado) entre la excitacin y la inhibicin.

B) La prueba del estmulo compuesto o sumacin

Volviendo al ejemplo del conejo y el parpadeo: Si hemos condicionado un estmulo para
inhibir la respuesta de parpadeo, obviamente no lo veremos parpadear, entonces cmo
podemos medir la eficacia que tiene nuestro estmulo inhibidor?

Mediante la Prueba de sumacin o del estmulo compuesto

La prueba de sumacin implica la presentacin de dos estmulos, un EC+ y un EC- juntos.
La idea es que cada estmulo produce su propia reaccin asociativa (excitacin e
inhibicin) y que cada reaccin se suma de forma algebraica. Puesto que son procesos
antagnicos, la asociacin inhibitoria suprime la excitatoria. Este efecto se cuantifica
midiendo la fuerza del estmulo condicionado excitatorio (EC+) sin emparejar, evalundolo
de nuevo en combinacin con el estmulo condicionado inhibitorio (EC-), y calculando
despus la diferencia. Si un EC- carece de fuerza inhibitoria, se observa toda la fuerza de
la reaccin excitatoria en ambos casos. Sin embargo, si el estmulo condicionado inhibitorio
es fuerte (produce RC inhibitoria), se observa una disminucin del nivel de excitacin del
EC+ al presentar los estmulos simultneamente




Principios de Aprendizaje y conducta
CAPITULO 3: CONDICIONAMIENTO CLSICO FUNDAMENTOS

C) La prueba del retraso en la adquisicin

Si un estmulo inhibe de forma activa una respuesta particular, entonces debera ser
especialmente difcil de condicionar ese estmulo para que provoque la conducta. Es decir,
la velocidad de adquisicin de una respuesta excitatoria debera disminuir si el EC es un
inhibidor condicionado.

Sin lugar a dudas estos 3 mtodos que acabamos de ver sobre inhibicin condicionada es
lo que ms me ha costado comprender desde que me he puesto a estudiar esta
asignatura. Tendr que pegarle un repaso profundo de cara al examen.


E) PREDOMINIO DEL CONDICIONAMIENTO CLSICO

Aparece con mayor probabilidad cuando un evento predice a otro regularmente y con una
demora corta entre el EC y el EI.

Un rea de investigacin importante es cmo las personas llegan a considerar que un
evento es la causa de otro. Hay una gran concordancia en los resultados de los
experimentos sobre juicios de causalidad y los de condicionamiento pavloviano. Por lo
tanto los mecanismos asociativos de Pavlov pueden tener un papel importante en nuestras
vidas (y no solo en la de los perros)

Algunos mbitos de la vida en los que se desarrolla el condicionamiento de Pavlov:

- Aversiones y preferencias alimenticias
- Adquisicin de miedos.
- Tolerancia y adiccin a las drogas
- Respuestas de los nios y de las madres durante la lactancia
- Situaciones sexuales


Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

A) A QU DEBEN SU EFICACIA LOS ESTMULOS CONDICIONADOS
E INCONDICIONADOS?

Respuestas iniciales a los estmulos

Pavlov: El EC inicialmente no provoca la respuesta condicionada pero adquiere la capacidad
de hacerlo como resultado del desarrollo de una asociacin con el EI.

Sin embargo la identificacin de EC y EI es relativa ya que un evento puede servir de EC
respecto a un estmulo y de EI respecto a otro. En experimentos con ratas la sacarina es un
EC si posteriormente se inyecta una droga que produce malestar (EI), entonces las ratas
aprenden a no tomar la sacarina. Sin embargo en un experimento en el que se proyecta una
luz (EC) justo antes de suministrar sacarina (EI) las ratas aprenden a acercarse a la luz cada
vez que aparezca. Por lo tanto esto es un ejemplo de que un estmulo (sacarina) puede actuar
como condicionado o incondicionado, dependiendo de su relacin con el otro estmulo.

La novedad de los estmulos condicionados e incondicionados

Cuando los estmulos son novedosos, el aprendizaje se desarrolla ms rpido.

A la hora de experimentar sobre la novedad o familiaridad de los estmulos, se realiza en
dos fases:

a) Se expone repetidamente a los sujetos al estmulo que luego ser EC.
b) EC se empareja con un EI

Sin embargo se observa que la familiaridad que el sujeto tiene con EC (ya que se le ha
repetido muchas veces en la fase a) hace que el emparejamiento con el estmulo
incondicionado sea ms lento. Este fenmeno se denomina efecto de preexposicin al
EC o efecto de Inhibicin latente.

La Habituacin sirve para sesgar la conducta elicitada a favor de los estmulos
novedosos.

La Inhibicin latente sirve para sesgar el aprendizaje a favor de los estmulos novedosos.
Es la habilidad de inconscientemente ignorar los estmulos que son percibidos como
irrelevantes para lo que uno necesita. (alguien vea Prison Break? En la serie el
protagonista sufre de un trastorno llamado Inhibicin latente baja, al ser baja l no
ignoraba absolutamente ningn estmulo y por eso era tan mquina y tan detallista a la
hora de construir cosas o trazar planes. Supongo que en la vida real este trastorno no debe
ser tan beneficioso para quien lo sufra como lo pintan en la serie)

Si el experimento lo hacemos con un EI, el resultado es el mismo. Quien estaba
familiarizado con el estmulo incondicionado tardar ms en relacionarlo con el EC. Esto
recibe el nombre de Efecto de preexposicin al EI.





Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

2 Mecanismos para explicar los dos efectos de preexposicin

Interferencia asociativa: Las preexposiciones a EC o EI disminuyen la capacidad de estos
estmulos para participar en nuevas asociaciones.
Interferencia de memoria: Los participantes recuerdan que en la fase a el estmulo se les
presentada aislado y este recuerdo altera la respuesta condicionada.

Intensidad y saliencia del EC y del EI

La intesidad de los estmulos es una variable importante que recibe el nombre de saliencia
del estmulo. El aprendizaje se llevar a cabo de manera ms rpida cuanto mayor sea la
saliencia del estmulo. Ratas con deficit nutricional de sal prestan ms atencin al sabor
de la sal (aqu se ha aumentado la saliencia del estmulo en relacin a las necesidades
biolgicas del organismo).

Relevancia o pertinencia EC EI

Es otra variable que afecta a la velocidad de aprendizaje del condicionamiento clsico La
relevancia es el grado en el que el EC es relevante con respecto al EI. En un ambiente natural,
es normal que las ratas enfermen tras tomar un alimento en mal estado. Tambin es normal
que sufran algn dao tras ser perseguidas por un animal al que pueden oir.

Ambas hiptesis son trasladadas al laboratorio donde se ponen en prctica para demostrar la
relevancia

Hiptesis 1: Dao por animal al que pueden oir

Experimento

A- Ratas lamiendo agua salada + luz que acompaa al lameteo = descarga elctrica

Luego se repeta el proceso pero cada estmulo por separado:

B- Ratas lamiendo agua salada + ausencia de luz = descarga elctrica
C- Ratas lamiendo agua sin sabor + luz que acompaa al lameteo= descarga elctrica

La medicin del aprendizaje se haca midiendo la supresin de volver a beber. (es decir,
cual de los dos estmulo har que la rata tenga menos tendencia a beber)
Conclusin: Demostraban mayor supresin con el estmulo audiovisual.

Hiptesis 2: Enfermar tras tomar un alimento en mal estado

Lo mismo que antes pero en lugar de la descarga elctrica se las haca enfermar con
drogas. La conclusin es que hacindolo de esta manera demostraban mayor supresin al
estmulo gustativo.

Todo esto de la relevancia tiene mucho que ver con la naturaleza y con la predisposicin
gentica. A la hora de aprender relaciones entre estmulos, no hay que olvidar las leyes
naturales, ya que pueden influir en nuestro aprendizaje. El libro pone unos cuantos
ejemplos ms sobre palomas y monos.

Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

Recuadro 4.1 Aproximaciones conductuales al control del tabaquismo
Destacar que las tcnicas ms efectivas para dejar de fumar son aquellas en las que el
estmulo aversivo es relevante en relacin a la situacin.

El concepto de fuerza biolgica

La fuerza biolgica es la fuerza que tiene cada estmulo (EC y EI) ante nosotros por
naturaleza. Pavlov sugiri que para que un estmulo se condicionara deba tener una fuerza
biolgica menor que el estmulo incondicionado.

Condicionamiento de orden superior (es como un condicionamiento al cuadrado. Aqu
se empieza a poner la cosa suave)

Situacin:

a) Un tono se empareja fuertemente con la comida.
b) La sola presencia del tono produce salivacin. (condicionamiento de 1er orden)
c) Empezamos a emparejar el tono (que produce salivacin) con una luz
d) Al final la sola presencia de la luz producir salivacin (condicionamiento de 2 orden)

Podemos seguir y volver a la rata loca y emparejar la luz por ejemplo con un olor,
(emparejamiento de tercer orden)

Nomenclaturas para no liarnos

EC
1
(tambin EC
+
) =Es el primer estmulo condicionado, osea, el tono
EC
2
(tambin EC
-
) = Es el segundo estmulo condicionado, osea la luz.

Recuadro 4.2 Condicionamiento de orden superior del miedo
Los miedos irracionales suelen desarrollarse por medio del condicionamiento de orden
superior. Se explica el ejemplo de una mujer con miedo a las multitudes cuyo miedo se
extendi a otros estmulos en principio inocuos, como ir al cine.

Contracondicionamiento

Dos estmulos pueden quedar asociados el uno con el otro aunque ambos eliciten
inicialmente respuestas intensas. La respuesta que un animal da a un EC se invierte o
contrarresta emparejando ese estmulo con un EI que provoca una reaccin opuesta.

Precondicionamiento sensorial

Se pueden aprender asociaciones entre estmulos que tan slo elicitan una breve
respuesta de orientacin antes del condicionamiento. Si asociamos los sabores de canela
y vainilla como algo que siempre va junto en los helados, y de repente nos sienta mal la
canela, tambin rechazaremos la vainilla.

Es parecido al condicionamiento de orden superior pero aqu hay cierta similitud en los
estmulos (dos sabores). Por eso se llama sensorial, es decir, tus sentidos los perciben
de manera similar.


Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

B) QU DETERMINA LA NATURALEZA DE LA RESPUESTA
CONDICIONADA?

El modelo de sustitucin del estmulo

A partir de ahora tanto EC como EI los voy a poner en negrita para diferenciarlos del
determinante masculino el ya que la un poco cuando va en mayscula.

Pavlov: Un EC adquiere la capacidad de funcionar de forma similar a como el EI lo haca
previamente. El EC activa los circuitos neuronales que previamente slo activaba el EI. El
EC se convierte en un sustituto del EI.

eI EI como factor determinante de la RC

Aqu habla de que la forma de la respuesta condicionada va a tener algo de relacin con
que tipo de EI haya.

Ejemplo en Palomas

Las Palomas abren el pico ms cuando van a comer grano que cuando van a beber.

EI = Grano
EI = Agua
EC= Tecla que se ilumina antes de dar agua o grano
RC= Respuesta de picoteo a la tecla (este ejemplo lo vimos en un tema anterior)

2 grupos de Palomas, uno con agua y otro con grano. Se demostr que el grupo que haba
relacionado el grano con la tecla, picoteaba la tecla con el pico ms abierto que el grupo
que haba relacionado la tecla con el agua (este grupo haca una especie de movimiento
de succin a la tecla). Por lo tanto dependiendo del EI (agua o grano) tendremos una RC
(picoteo grande o succin) al EC (tecla) diferente.

Aprendizaje y homeostasis: Un caso especial de sustitucin del estmulo

Como hablbamos en temas anteriores, homeostasis = equilibrio.

La homeostasis se refiere a los mecanismos fisiolgicos que mantiene los aspectos crticos
del cuerpo dentro de los lmites aceptables. Cualquier amenaza a nivel homeosttico pone
en marcha una reaccin compensatoria que neutraliza la alteracin. Esta reaccin funciona
por procesos de retroalimentacin negativa (Walter Cannon). La exposicin al fro
produce escalofros para incrementar la temperatura del cuerpo.

Dworkin seal que las alteraciones en la homeostasis pueden compensarse ms
efectivamente si pueden anticiparse. Si los sujetos pueden aprender qu claves sealan
cundo van a tener fro, pueden realizar ajustes compensatorios que se anticipen al fro.
Esto recibe el nombre de respuesta homeosttica condicionada. (a continuacin vamos
a relacionar este tipo de respuestas con la administracin de drogas psicoactivas en
sujetos. Particularmente el punto que viene a continuacin me resulta muy interesante.)


Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

Las drogas suelen provocar alteraciones fisiolgicas de la homeostasis que activan
reacciones compensatorias condicionadas. Las claves que se asocian a esta alteracin
pueden elicitar estas reacciones compensatorias como respuestas condicionadas
anticipatorias.

A) Proceso normal=Drogas - Alteracin homeostasis reacciones compensatorias
condicionadas

Tomo la droga, me altera la homeostasis y eso provoca una reaccin compensatoria
condicionada.

B) Proceso en el que pienso en la droga pero no la tomo = Claves de droga (drogas-
alteracin homeostasis) reacciones compensatorias condicionadas respuestas
condicionadas anticipatorias.

Pienso en que es un buen momento para tomar la droga pero an no la tomo. El hecho de
pensar lo relaciono directamente con su efecto y con el contraefecto que da mi cuerpo y se
produce la reaccin compensatoria condicionada y por lo tanto la respuesta condicionada
anticipatoria. La ansiedad por consumir droga que suelen mostrar los consumidores
habituales es una manifestacin de estas respuestas condicionadas anticipatorias.

En un experimento con consumidores habituales de cocana y no consumidores, les
presentaban imgenes relacionadas con el consumo de cocana e imgenes sin relacin
con la droga. Al grupo de consumidores les aumentaba el ritmo cardiaco con las imgenes
relacionadas con el consumo.

El modelo de condicionamiento de tolerancia a las drogas

Siempre se ha considerado que la tolerancia a las drogas se deba a procesos
farmacolgicos, sin embargo Shepard Siegel encuentra otra explicacin basada en el
condicionamiento clsico La explicacin se basa en el concepto de homeostasis
aprendida.

Tomamos droga y se producen unos cambios fisiolgicos en nuestro organismo (son el EI).
Entonces se ponen en marcha unos ajustes para compensar esos cambios, son la
respuesta incondicionada (RI).

Entonces

Mediante el condicionamiento pavloviano o clsico, los estmulos que acompaan a la
administracin de droga se asocian con el EI. Estos estmulos condicionados pueden ser la
hora del da, o el lugar donde se consume droga habitualmente.

Por lo tanto

- Droga provoca EI
- EI provoca RI
- EI siempre va con EC (lugar y hora)
-EC provoca RI (es decir, el lugar y la hora provocan mi respuesta fisiolgica para
compensar los cambios que me producir la droga, por lo tanto tomar droga en sitios
habituales me colocar menos).
Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

el EC como determinante de la forma de la RC

Lo que hemos visto antes de las Palomas y la tecla pero con el EC de protagonista.

Ejemplo en ratas. Para variar

A una rata A se le presentaba otra rata B atada que actuaba como EC, 10 segundos antes
de presentarle la comida. A fuerza de presentarle la rata B (EC) antes de la comida (EI) se
quera observar si la respuesta normal que dara la rata A ante la comida (morder, roer)
comenzara a darla con la sola visin de la otra rata. Sin embargo esto no fue as, sino que
la rata A mostraba actitudes sociales ante la rata B. Por lo tanto estas actitudes sociales
estaban sin duda determinadas por la naturaleza del EC (la rata B).

Conducta condicionada y sistemas de conducta

Un sistema de conducta consiste en una serie de modos de respuesta, cada uno de ellos
con sus propios estmulos y respuestas relevantes, dispuestos con determinado orden
espacial y/o secuencial.

Esta teora asume que la presentacin de un EI activa el sistema de conducta (formado por
uno o varios EC) para ese EI.

La presentacin de un estmulo sexual para la codorniz macho (EI) activa una secuencia
de:

Conducta de bsqueda general (EC),
Conducta de bsqueda focal (EC)
Conducta consumatoria (EI)

La forma de la RC depende del intervalo EC-EI que se utilice. La razn es que el intervalo
EC-EI determinar el lugar en el que se incorporar el EC dentro de la secuencia de
respuestas del sistema de conducta. El EC no sustituye ni compensa al EI. En lugar de
eso, sustituye a un estmulo en un punto del sistema de conducta determinado por el
intervalo EC-EI.

Aprendizaje E-R frente a aprendizaje E-E

Aprendizaje E-R: Este aprendizaje establece una nueva conexin Entre el EC y la RC

Aprendizaje E-E: Es una visin ms moderna, en la que los individuos aprenden una
asociacin entre el EC y el EI. Los sujetos responden al EC, no porque ste elicite
directamente la RC sino porque el EC hace que el sujeto piense en EI.

Cmo pueden los investigadores decidir entre estas dos interpretaciones?

Mediante la tcnica de la devaluacin del EI, que consiste en la reduccin del atractivo
de un estmulo incondicionado, normalmente obtenida mediante la aversin o la saciedad.




Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

C) CMO SE ASOCIAN LOS ESTMULOS CONDICIONADO E
INCONDICIONADO?

El efecto de bloqueo

Si tenemos dos estmulo A y B y emparejamos fuertemente el estmulo A con un EI,
provocando una respuesta condicionada intensa, y luego presentamos los dos estmulos
(A y B) conjuntamente junto al EI, se observa que el condicionamiento de A no se extiende
a B.

Ejemplo con el pastel de la abuela

Todos los domingos visito a mi abuela y me hace un pastel de arroz (A) que me sienta mal
(EI). Aprendo a tenerle aversin al pastel de arroz. Tiempo despus me sorprende un da
al acompaar el pastel de arroz de galletas (B). Me vuelve a sentar mal (EI) pero pienso
que sigue siendo culpa del pastel de arroz y no de las galletas.

Porqu la presencia del estmulo A previamente condicionado bloquea la
adquisicin de la respuesta a B?

Kamin seala que el EI debe ser sorprendente. Es decir si el EI va sealado por un
estmulo previamente condicionado (A), no sorprender al sujeto y, por tanto no funcionar
bien a la hora de condicionar al estmulo aadido (B). En el ejemplo anterior soy consciente
de que cuando tome el pastel de arroz me sentar mal, asi que el hecho de acompaarlo
con galletas no lo atribuir a mi malestar.

Recuadro 4.3 El problema dibujo-palabra en la enseanza de la lectura: Una forma de
bloqueo. El aprendizaje de la lectura mediante la presentacin de palabras y dibujos
puede producir procesos similares al bloqueo. Por esta razn hay que utilizar estos
mtodos con precaucin ya que pueden dificultar el aprendizaje en lugar de facilitarlo.

El modelo de Rescorla y Wagner (esto con muuuuucha calma y leyendo el libro
detenidamente ya que los siguientes puntos son casi imposibles de resumir. He extrado
las ideas principales)

Se trata de un modelo matemtico que explica porqu la efectividad de un EI est
determinada por el grado en que resulta sorprendente.

Pueden haber:

- EI inesperadamente grandes: Son la base del condicionamiento excitatorio
- EI inesperadamente pequeos: Son la base del condicionamiento inhibitorio

Y todo esto se puede explicar mediante una frmula matemtica:

!V = k( " - V )

" : Asntota de aprendizaje
V: Valor asociativo de los estmulos que preceden al EI
k: Constante relacionada con la saliencia del EC y del EI
!V: Cambio en el valor asociativo de un estmulo
Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS


Al principio del aprendizaje V est cercano a 0 ya que los estmulos que preceden al EI no
los relaciono para nada con EI (por eso es una sorpresa). Como V est cerca de 0, el
resultado de ( " - V ) ser bastante grande. Por lo tanto !V (la sorpresa) ser mayor al
principio del aprendizaje.

Sin embargo conformen vayamos haciendo ensayos, V va creciendo al incrementarse su
valor de asociacin con el EI. Como V va creciendo, el resultado ( " - V ) ser menor. Por
lo tanto !V (la sorpresa) ser menor al final del aprendizaje.

Aplicacin al efecto de bloqueo

Final de la primera fase: V
A
= "
Segunda fase: No hay condicionamiento del estmulo B en la fase 2, ya que el EI es
predecible por la presencia del estmulo A:

EI = ("-V
A+B
) = 0

Prdida del valor asociativo a pesar de los emparejamientos con el EI

El modelo Rescola-Wagner predice que los estmulos perdern valor asociativo si se
presentan juntos en un ensayo de condicionamiento despus de haber sido entrenados por
separado.

Fase 1
- Asociamos el estmulo A con una bolita de comida (EI)
- Paralelamente asociamos el estmulo B con la misma bolita de comida (EI)

Ambos estmulos se han condicionado perfectamente, de manera que predicen
perfectamente el EI de una bolita de comida, es decir, V
A
= V
B
= "

Fase 2
- Presentamos ambos estmulos conjuntos (A y B) con la bolita de comida (EI)

Al no haber cambios en el EI, las propiedades de A y B adquiridas en la fase 1 deberan
mantenerse, y sin embargo el modelo predice que se van a reducir. porqu sucede esto?

Porque la expectativa basada en los estmulos individuales son 2 bolitas de comida y sin
embargo se le presenta 1 nica bolita. Por lo tanto existe una discrepancia entre lo que se
espera (2 bolitas) y lo que se presenta (1 bolita). Los participantes encuentran que el EI es
sorprendentemente pequeo, por lo tanto para ajustar la expectativa a lo que realmente
ocurre, A y B perdern valor.

Inhibicin condicionada (mirar el grfico de la pgina 82 del tema 3 para recordar qu
era la inhibicin condicionada)

La inhibicin condicionada consta de dos tipos de ensayos:

- Ensayos reforzados: Se presenta el EI
- Ensayos no reforzados: Se omite el EI

Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirir propiedades
excitatorias.

Por el contrario, en los ensayos no reforzados, el EI no ocurre (a pesar de que lo
esperamos como consecuencia de nuestro aprendizaje en los ensayos reforzados). Se
trata de un caso de expectativa excesiva.

Para predecir con exactitud la ausencia de EI en los ensayos no reforzados, los valores
asociativos de EC+ y EC- tienen que sumar cero.

Extincin de la excitacin y la inhibicin (grfico pg 115)

Excitacin:
En este procedimiento, el estmulo condicionado se presenta repetidamente con el EI.
Como el EC ha adquirido fuertes propiedades excitatorias, la primera vez que se presenta
solo el EC habr un exceso de expectativa a que tambin se presente el EI. Conforme se
siga presentado el EC solo, la expectativa de que aparezca EI se va acercando a 0.

Inhibicin:
Es un poco lo contrario que el caso anterior. Aqu el EC- comienza con un valor asociativo
negativo que se considera una prediccin excesivamente baja del EI. Para ajustarse a las
expectativas, el valor asociativo negativo del EC- se va perdiendo hasta llegar a 0.

Problemas del modelo de Rescorla y Wagner

1 Problema: Su anlisis de la extincin de la inhibicin condicionada es incorrecto (no
tenemos suficiente con estudiar a los que acertaron). El modelo predice que la
presentacin repetida de un inhibidor condicionado (EC-) sin el EI debera dar lugar a una
prdida de la inhibicin condicionada, pero esto no sucede.

2 Problema: El modelo considera la excitacin como lo opuesto a la extincin. Y no debe
verse as.

3 Problema: El modelo solo permite que los EC tengan un nico valor asociativo (EC+ o
EC-) sin embargo se ha descubierto que en ciertas condiciones puede tener ambos.

4 Problema: El modelo tiene dificultades para explicar hallazgos recientes obtenidos en
los paradigmas de aversin al sabor y el olor. Concretamente tiene problemas para
explicar el efecto de aumento o contrabloqueo. (el estmulo previamente condicionado
aumenta el condicionamiento del EC aadido)

Otros modelos de condicionamiento clsico

Modelos atencionales de condicionamiento

Para que el condicionamiento tenga lugar, los sujetos deben prestar atencin al EC.

- Se asume que el grado de atencin que un animal presta al EC en un ensayo
determinado depende del grado en el que el EI haya sido sorprendente en el
ensayo anterior.
Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

- La sorpresividad del EI en un ensayo determinado altera el grado de atencin
dedicado al EC en los ensayos siguientes. Por lo tanto la sorpresividad del EI tiene
slo un efecto prospectivo o proactivo sobre la atencin y el condicionamiento (esta
es la principal diferencia con el modelo de nuestros amigos Rescorla y Wagner)

Factores temporales y respuesta condicionada

- Ninguno de los modelos vistos hasta ahora explica los efectos del tiempo sobre el
condicionamiento. Sin embargo el intervalo EC-EI es una variable temporal
importante ya que los intervalos EC-EI ms largos producen menos respuestas. (la
respuesta es inversamente proporcional a la duracin del intervalo)

- Otra variable importante es el intervalo entre ensayos sucesivos. Se observa una
mayor respuesta condicionada cuando se utilizan procedimientos en los que los
ensayos estn ms separados entre s.

Experimento en ratas

Se presentaba comida (EI) en un comedero y cada presentacin de la comida va precedida
por un ruido blanco (EC). A medida que avanza el experimento, las ratas comienzan a ir al
comedero y a explorarlo tan pronto escuchan el sonido.

IEE: Intervalo entre ensayos
ED: Duracin del ensayo (es decir, la duracin que tiene el sonido)

La conclusin es que para cada grupo de sujetos, el tiempo dedicado a explorar el
comedero durante la presentacin del EC, vara segn la duracin del EEI y el ED.

Existen distintas interpretaciones sobre porqu la respuesta condicionada est tan
fuertemente determinada por la razn IEE/DE. Vamos a ver dos hiptesis a continuacin.

Hiptesis del tiempo de espera relativo

Un EC proporciona informacin acerca de la aparicin del EI, slo si el sujeto tiene que
pasar menos tiempo esperando al EI tras la presentacin del EC que cuando est
simplemente expuesto al contexto experimental.

-Razn IEE/DE baja = tiempo de espera similar al contexto = EC da poca info sobre aparicin EI
-Razn IEE/DE alta= tiempo de espera menor que el contexto= EC da mucha info sobre aparicin EI

Hiptesis del comparador

La respuesta condicionada depende no slo de la asociacin entre el EC y el EI, sino
tambin de todas las posibles asociaciones que puedan establecerse entre las claves
contextuales y el EI.

Ejemplo grfico de una balanza en pgina 120: Se compara el peso o valor del EC crtico
frente al valor excitatorio de las claves contextuales.

A diferencia de la hiptesis del tiempo de espera relativo, la hiptesis del comparador se
centra ms en las asociaciones que se puedan producir.

Principios de Aprendizaje y conducta
CAPITULO 4: CONDICIONAMIENTO CLSICO MECANISMOS

Se asume que los organismos aprenden 3 asociaciones en el curso del tiempo (grfico
121:

1 asociacin: Une el EC crtico (X) con el EI. (de forma directa)
2 asociacin: Une el EC crtico con las claves contextuales de comparacin
3 asociacin: Une los estmulos de comparacin y el EI (de forma indirecta)

- La hiptesis del comparador no indica cmo se establecen las asociaciones, se
trata de una teora de ejecucin, no de aprendizaje.
- La comparacin entre las asociaciones (EC-EI) y (contexto-EI) se realiza en el
momento de la prueba.
- Tambin se ha probado esta hiptesis en estudios sobre inhibicin condicionada.
Atribuye la inhibicin condicionada a situaciones en las que la asociacin del EC
crtico con el EI es ms dbil que la asociacin de las claves contextuales con el EI.
(esto se entiende observando la balanza de la pgina 120, en el medio tenemos un
medidor apuntando al 0 y dependiendo de lo que tenga ms valor se desplazar
hacia la izquierda (inhibicin) o hacia la derecha (excitacin).
- Es la nica hiptesis que predice que la extincin de la inhibicin condicionada se
puede lograr no presentando el EC- de forma aislada, sino extinguiendo las claves
que sirven de EC+ y que proporcionan el contexto excitatorio para el
condicionamiento inhibitorio del EC-.
- El modelo predice tambin que incrementar el valor excitatorio de las claves
contextuales tras el tratamiento reducir la respuesta condicionada del EC crtico.
- Otra contribucin ha sido suponer que las diferencias en la respuesta condicionada
pueden reflejar diferencias en la ejecucin ms que en el aprendizaje.

Visin general de las alternativas tericas (un poco resumen de lo visto)

- Hiptesis del tiempo: Se centra en la distribucin temporal
- Hiptesis del comparador: Es una teora de la ejecucin ms que del aprendizaje
- Modelos atencionales: Se parece ms a Rescorla-Wagner pero tambin comparte sus
limitaciones.

Sin embargo ninguna de estas 3 tuvo tanta fama en el condicionamiento clsico como el
modelo Rescorla-Wagner en los setenta.
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

A diferencia de los captulos anteriores, en este tema los estmulos a los que un
organismo se enfrenta son resultado de su conducta. Es lo que se conoce como
conducta dirigida a una meta.

Un estudiante estudiar para obtener mejores notas. Este tipo de conducta se utiliza
porque ha servido previamente como instrumento para conseguir lo mismo y recibe el
nombre de conducta instrumental.

A) PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO
INSTRUMENTAL

Comienzan con Thorndike. Su intencin original era estudiar la inteligencia animal.

Sus experimentos se basaban en introducir animales hambrientos en cajas con comida en
el exterior y a la vista del animal. El animal deba aprender cmo salir de la caja.

Los resultados son obvios, con la repeticin elanimal cada vez tarda menos tiempo en
repetir la accin que abre la caja. Sin embargo hay que hacer una puntualizacin,
Thorndike no explicaba que los animales compredieran el funcionamiento del mecanismo
que abra la caja, sino que la abran como una asociacin estmulo-respuesta. Es decir, un
gato por ejemplo daba muchas respuestas al introducirlo en la caja, alguna de estas
respuestas (de casualidad) abran la caja, por lo tanto el animal poco a poco ira
aprendiendo esta asociacin y comenzara a dar con mayor frecuencia el tipo de
respuestas encaminadas a volver a abrirla. Yo no entiendo cmo se abre la puerta de mi
coche con el mando a distanciapero cada vez que quiero abrirla le doy al botn porque
es lo que he aprendido.

Ley del efecto: Si una respuesta en presencia de un estmulo es seguida por un suceso
satisfactorio, la asociacin entre el estmulo (E) y la respuesta (R) se fortalece. Si la
respuesta es seguida por un suceso molesto, la asociacin E-R se debilita. La ley del
efecto implica un aprendizaje E-R.

B) APROXIMACIONES MODERNAS AL ESTUDIO DEL
CONDICIONAMIENTO INSTRUMENTAL

Procedimientos de ensayo discreto

Normalmente se llevan a cabo en laberintos

W.S. Small (1899-1900) cre laberintos para estudiar la conducta de las ratas. Uno tena
forma de T (para estudiar la conducta de eleccin )y otro era simplemente alargado con
forma de I (grficos pg 129).

Con los laberintos se puede medir la velocidad de la carrera (desde la salida hasta la
meta) y el tiempo de latencia (tiempo que tarda en abandonar la salida e iniciar la carrera).




Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

Procedimientos de operante libre

Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin
restricciones.(a diferencia de los laberintos en T en que el animal era sacado del laberinto
al llegar a meta). Skinner quera obtener una respuesta ms natural en los experimentos.
La observacin informal sugiere que la conducta en curso es un continuo, una actividad
sigue a la otra. Skinner propuso el concepto de operante como la forma de dividir la
conducta en unidades medibles con significado.

Foto pgina 131: Rata hambrienta en una caja de Skinner. Hay una palanca conectada a
un dispensador de comida. Cuando la rata aprieta la palanca cae comida.

La respuesta operante (presionar la palanca) se define a partir del efecto que produce en
el ambiente. El operante de presin de la palanca se define como una presin hacia abajo
suficiente para que cause el cierre del microinterruptor. Da igual si la presin la hace con la
pata izquierda, derecha o con la cola, se trata del mismo operante.

Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un
seguimiento del signo mediante un sonido (condicionamiento clsico) para que el animal se
dirija al comedero. (esto es el entrenamiento al comedero). Tras este entrenamiento el
animal est preparado para aprender la respuesta instrumental. Si la respuesta NO ES
ALGO que el animal ya realiza ocasionalmente NUNCA suceder por si misma la
respuesta que produce el reforzador. Es decir, para empezar le daremos comida a la rata
cada vez que se levanta sobre sus dos patas de forma natural (obviamente si en lugar de
una rata fuera una rana, nunca podr ponerse a dos patas). Cuando hemos conseguido la
respuesta de alzamiento entonces daremos un paso ms y le daremos la comida SOLO SI
realiza la respuesta de alzamiento sobre la palanca. Poco a poco vamos produciendo un
moldeamiento hasta conseguir la respuesta buscada.

Esta dos fases que hemos visto del modeamiento son: reforzamiento de aproximaciones
sucesivas y no reforzamiento de las formas de respuesta tempranas

Moldeamiento y nueva conducta Toda la nueva unidad conductual de la rata est
formada por un conjunto de respuestas preexistentes (alzamiento, presin, etc). Es decir,
se le ensea una nueva combinacin de respuestas familiares en una nueva actividad.

Es importante sealar que el moldeamiento aprovecha la variabilidad inherente de la
conducta. Es decir, se puede variar la conducta en una direccin u otra. El libro habla de
un experimento sobre el picoteo en palomas en el que dependiendo del reforzador
conseguan que su conducta tendiera a ir cerrando ms el pico con el picoteo o lo
contrario, ir abriendo ms el pico con el picoteo.

Con el mismo experimento se obtenan resultados que explicaban que el moldeamiento
puede producir nuevas formas de respuesta nunca antes realizadas por el organismo.
Antes de los experimentos las palomas conseguan abrir el pico 10 mm, pero tras el
moldeamiento llegaban hasta 20 mm.

La tasa de respuesta como medida de la conducta operante Los experimentos con
operante libre permiten una observacin continua durante largos periodos (a diferencia del
ensayo discreto). Skinner propuso la tasa de ocurrencia (frecuencia de la respuesta por
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

minuto) como medida de la probabilidad de una respuesta. Las respuestas ms probables
ocurren con frecuencia y muestran una tasa alta.

C) PROCEDIMIENTOS DE CONDICIONAMIENTO
INSTRUMENTAL

Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos:

- Estimulo apetitivo: Una consecuencia placentera.
- Estmulo aversivo: Una consecuencia molesta.
- Contingencia positiva: La respuesta instrumental proporciona el estmulo (un
chico corta el csped y recibe dinero)
- Contingencia negativa: La respuesta instrumental evita el estmulo (cierro la
ventana y no entra lluvia)

Importante la tabla de la pgina 134
Y ahora los 4 procedimientos que dan ttulo al apartado:

Reforzamiento positivo: Un padre da una galleta a su hija cuando hace los deberes. La
respuesta instrumental produce un estmulo apetitivo. Por lo tanto existe contingencia
positiva entre la respuesta y el estmulo.

Castigo: Un jefe te critica por llegar tarde a una reunin. La respuesta instrumental
produce un estmulo aversivo. Y OJO: Aqu tambin se produce una contingencia positiva
entre la respuesta y el estmulo. (llegar tarde produce que el jefe te ria)

Reforzamiento negativo: Se trata de un procedimiento en el que la respuesta
instrumental finaliza o previene la entrega de un estmulo aversivo. Hay dos tipos de
reforzamiento negativo:

A) Escape: Se presenta el estmulo aversivo pero puede ser eliminado por la
respuesta instrumental. Se puede escapar del sonido molesto de una radio
apagndola.
B) Evitacin: Implica la programacin de un estmulo aversivo para ser presentado en
algn momento del futuro. La gente pone a punto su coche para evitar averas.

Entrenamiento de omisin: La respuesta instrumental previene la presentacin de un
estmulo apetitivo. Se le dice a un nio que se vaya a su habitacin cuando ha hecho algo
malo no porque la habitacin sea algo aversivo sino para evitar estmulos apetitivos como
ver la televisin o que lo llamen sus amigos. El entrenamiento de omisin tambin recibe el
nombre de reforzamiento diferencial de otras conductas o RDO. El RDO refleja el hecho
de que el individuo recibe un estmulo apetitivo peridicamente a condicin de que se
dedique a realizar otra conducta diferente a la anterior.

Aunque ya lo he sealado antes, pero repito la importancia del cuado de la pgina 134
para evitar confusiones con estos trminos.



Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

D) ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO
INSTRUMENTAL

El condicionamiento instrumental consta de 3 elementos claves:

- Una respuesta
- Una consecuencia (el reforzador)
- Relacin (o contingencia) entre la respuesta y la consecuencia
1. La respuesta instrumental

Variabilidad conductual versus estereotipia

Los experimentos de Thorndike y Skinner enfatizaron que el reforzamiento incrementa la
probabilidad de que la respuesta instrumental se repita en el futuro. Es decir, repeticiones
de la misma respuesta. Sin embargo esto no significa que el condicionamiento instrumental
no pueda producir tambin respuestas creativas o variables. Los organismos pueden
aprender a obtener reforzamiento en una situacin donde se requiere hacer algo nuevo.
Por lo tanto la variabilidad de la respuesta puede ser la base para el reforzamiento
instrumental. Y esto se demostr con un experimento en palomas:

Page y Neuringer (1985) Experimento en Palomas. Las palomas tenan que picotear 2
teclas durante 8 veces para obtener comida. Podan alternar los picoteos como quisieran
siempre que fuesen 8 entre dos teclas. Tras 50 ensayos solo recibiran comida si no
repetian ninguna de las combinaciones de los 50 ensayos del principio. Paralelamente un
grupo de control reciba comida independientemente de si repeta o no. Los resultados
demostraron que el grupo que no tena que repetir las combinaciones daba mucha ms
variabilidad en su respuesta que el grupo de control, creando combinaciones nuevas.

Por lo tanto:

- La variabilidad de la respuesta puede mantenerse e incrementarse por
reforzamiento.
- En ausencia de reforzamiento explcito de la variabilidad, la respuesta llega a ser
ms estereotipada con un condicionamiento instrumental continuado.

Relevancia o pertinencia en el condicionamiento instrumental

Esto es muy parecido a lo que vimos en el condicionamiento clsico cuando hablbamos
de facilidad de aprendizaje cuando el EC era relevante para el EI en temas anteriores.

En el condicionamiento instrumental ocurre algo parecido, Thordike estudi las respuestas
de gatos atrapados en cajas. Primeramente condicion el rascado y el bostezo como
respuestas instrumentales para escapar y en otros experimentos condicion manipular un
picaporte o tirar de una anilla. Demostr que cuando se trataba del picaporte o la anilla, la
respuesta era mucho ms vigorosa que cuando se trataba del bostezo y el rascado. La
evolucin natural del gato hace que manipular un picaporte y empujar una anilla son
respuestas que estn relacionadas de forma natural con escapar de la trampa. Con esto se
explica el concepto de pertinencia.

Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

Deriva instintiva: Breland y Breland observaron varias limitaciones y problemas a la hroa
de entrenar animales para realizar exhibiciones en circos. Observaron que los animales
realizaban conductas relacionadas con su forma de alimentacin en lugar de reproducir la
conducta buscada por los educadores.

Sistemas de conducta y limitaciones en el condicionamiento instrumental

De acuerdo con la teora de los sistemas de conducta, cuando un animal est privado de
comida y se encuentra en una situacin donde podra encontrarla, su sistema de
alimentacin se activa y se dedica a otras actividades relacionadas con la comida. De
acuerdo con la aproximacin de los sistemas de conducta, deberamos ser capaces de
predecir qu respuestas se incrementarn con un reforzamiento de comida mediante el
estudio de lo que los animales hacen cuando su sistema de alimentacin est activado en
ausencia de condicionamiento instrumental. Esto suena un poco lioso pero se entiende con
el siguiente ejemplo:

Cuando un hamster tiene comida suficiente se dedica a otras actividades como el
autocuidado (lavarse, etc) pero cuando est hambriento su sistema de conducta se centra
en otras actividades como rascar o comer. Por lo tanto podemos concluir que el
autocuidado no est relacionado con su sistema de conducta de la alimentacin y que el
reforzamiento de comida podra producir incrementos en actividades como cavar y
escarbar pero no en lavarse la cara y rascarse.

2. El reforzador instrumental

Cantidad y naturaleza del reforzador

Las dos caractersticas estn muy relacionadas. Tener un reforzador ms grande o ms
sabroso (en el caso de la comida) provocar respuestas ms intensas en los sujetos.

Cambios en la naturaleza y cantidad del reforzador

Esto est relacionado con el modelo Rescorla-Wagner visto en el tema anterior.

Si el EI es mayor de lo esperado, producir condicionamiento excitatorio. Si por el contrario
el EI es menor de lo esperado, producir condicionamiento inhibitorio. Si trabajas por 9
euros/hora durante 6 meses y el septimo mes te siguen pagando lo mismo, ser menos
emocionante que trabajar 6 meses a 8 euros y luego a partir del septimo mes subirte a 9
euros. Es probable que los trabajadores del segundo grupo sean ms productivos (para
quien tenga psicologa de la motivacin, en la PEC 1 hay un ejercicio que trata este tema)

Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable
resultado de una experiencia anterior con una consecuencia menos atractiva.

Contraste negativo: Se refiere a una respuesta disminuida por una recompensa
desfavorable debido a una experiencia anterior con una consecuencia mejor.

Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes
fases del experimento y slo un cambio en la magnitud de la recompensa para los grupos
de cambio.
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

Contraste conductual simultneo: Efectos de contraste conductual (contraste positivo y
negativo) que estn producidos por frecuentes cambios entre una condicin de
recompensa favorable y una desfavorable, con cada condicin de recompensa asociada
a su propio estmulo distintivo.

Todos los efectos de contraste ilustran que la efectividad de un reforzador en una
situacin est determinada en parte por las experiencias del organismo con reforzadores
en otras situaciones.


3. La relacin respuesta-reforzador

En algunos casos hay una fuerte relacin entre lo que una persona hace y la consecuencia
que sigue, en otros casos no hay ninguna relacin y en otros casos la relacin puede ser
probabilstica. Un organismo debe organizar su tiempo para enfrentarse a varios retos y
debe hacerlo de manera que lleve a cabo el mejor uso de su tiempo y energa.

2 tipos de relaciones entre una respuesta y un reforzador

a) Relacin temporal (o contigidad temporal): Tiempo que transcurre entre la
respuesta y el reforzador. En la Contigidad temporal el reforzador se entrega
inmediatamente despus de la respuesta.
b) Relacin causal: (o contingencia respuesta-reforzador). Se refiere al hecho de que
la respuesta instrumental es necesaria y suficiente para la ocurrencia del
reforzador.

Efectos de la contigidad temporal

El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador
inmediatamente despus de la ocurrencia de la respuesta instrumental facilita el
aprendizaje. Hay varios factores que explican porqu el condicionamiento instrumental es
tan sensible a la demora del reforzamiento:

- Una demora larga hace que el sujeto no sepa cual de sus respuestas haya sido la
que ha producido el reforzador. Es decir, la rata levanta una palanca pero pasan
30 segundos hasta que se muestra una bolita de comida, durante estos 30
segundos la rata sigue haciendo otras cosas como pueden ser saltar, morder,
etc., de repente surge la bolita y la rata ya no asocia la bolita con la palanca inicial
ya que despus ha seguido dando una serie de respuestas (saltar, morder, etc.) y
no sabe cual de ellas ha sido la que ha propiciado la salida de la bolita.

- Para resolver este problema se entrega un reforzador condicionado o
secundario inmediatamente despus de la respuesta instrumental y que ha sido
asociado previamente con el reforzador. Por ejemplo en el adiestramiento verbal de
animales se dice bueno o eso es y cuando acabe la exhibicin se le dar la
comida.

- Otra manera de resolver el problema es mediante un procedimiento de
marcado de la respuesta instrumental correcta. Experimento en ratas. Una caja
con un brazo negro y otro blanco. El blanco es la respuesta correcta, el grupo de
Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

ratas que daba la respuesta correcta se dividi en 2 subgrupos, uno de estos
subgrupos era extraido de la caja en el momento de entrar en el brazo blanco y
llevado a otra caja a experar la comida. El otro subgrupo no era extrado de la caja,
sino que esperaba a recibir la comida en ella durante 60 segundos. Se demostr
que el grupo que era extrado (marcado) de la caja, tena un porcentaje de
respuestas correctas superior en experimentos posteriores que el grupo que no
haba sido extrado. Es decir, hay que hacer algo inmediatamente despus de la
respuesta instrumental para que el animal se percate de que lo que acaba de hacer
es la eleccin correcta.

La contingencia respuesta-reforzador

Repite lo anterior al principio del apartado pero aade que: Aunque la relacin causal sea
perfecta, el condicionamiento no ocurrir si el reforzamiento es demorado durante
demasiado tiempo.

El experimento de supersticin de Skinner

Muy interesante y gracioso: Meti a 8 palomas en 8 cajas distintas que estaban
programadas para dar comida cada 15 segundos independientemente de lo que
estuviesen haciendo las palomas. Al rato volvo y comprob que cada paloma estaba
haciendo una cosa, unas daban vueltas otras picoteaban, etc, como si su comportamiento
condicionara el hecho de que apareciese o no apareciese comida. Skinner denomin a
esto conducta supersticiosa. Seguro que ms de uno hacemos cosas parecidas.

Skinner explica esta conducta mediante la idea del reforzamiento accidental o
adventicio que se refiere al emparejamiento accidental de una respuesta con la entrega
del reforzador. Este experimento sugera que una contingencia positiva respuesta-
reforzador no es necesaria para el condicionamiento instrumental.

Reinterpretacin del experimento de supersticin: Staddon y Simmelhag profundizaron un
poco ms en el experimento de Skinner y dieron nombre a las conductas de las palomas.
Denominaron respuestas terminales a las que se daban al final del intervalo comida-
comida y respuestas de intern a las que se daban en medio del intervalo. Las Palomas
solan coincidir en el tipo de respuestas terminales y en el tipo de respuestas intern. Por lo
tanto hay algo de contingencia entre el tipo de respuestas y el reforzador (al contrario de
cmo sugera Skinner)

Explicacin de la periodicidad de las respuestas de intern y terminales: Staddon y
Simmelhag sugirieron que las respuestas terminales son respuestas tpicas de la especie
que reflejan la anticipacin de comida a medida que el tiempo se encuentra ms cerca de
la prxima presentacin de comida. En contraste, las respuestas intern son una
manifestacin de otras fuentes de motivacin que eran ms importantes al comienzo del
intervalo entre comidas, cuando la presentacin de comida era improbable.






Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el
orden temporal tras la ltima aparicin de comida:

a) Bsqueda focalizada poscomida (cerca del cuenco)
b) Bsqueda general (lejos del cuenco)
c) - Bsqueda focalizada (cerca del cuenco otra vez)

Efectos de la controlabilidad de los reforzadores

Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la
respuesta instrumental. Un hallazgo importante en experimentos con perros fue que la
exposicin a una descarga incontrolable dificultaba el aprendizaje posterior. Este efecto
recibe el nombre de efecto de indefensin aprendida.

Y ahora 6 puntos que tienen que ver con el efecto de indefensin aprendida:

1. El diseo tridico: (tabla pgina 153)

Los experimentos de indefensin aprendida se realizan utilizando el diseo tridico.

Contiene 2 fases:

a) Exposicin

Grupo de ratas E: Expuesto a descargas peridicas de las que pueden escapar.
Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe
las mismas descargas pero no pueden escapar de ellas.
Grupo C: No recibe descargas pero est confinado en el aparato tanto tiempo como los
otros.

b) Condicionamiento

Los 3 grupos reciben entrenamiento de escape evitacin

Resultados: La exposicin a una descarga incontrolable (Grupo A) produce peores
resultados en el aprendizaje escape-evitacin que el resto de los grupos. La diferencia en
la tasa de aprendizaje entre los grupos muestra que los animales son sensibles a la
contingencia respuesta-reforzador.

2. Hiptesis de la indefensin aprendida: Esta hiptesis asume que durante la exposicin a
descargas incontrolables, los animales aprenden que las descargas son independientes de
su conducta, no pueden hacer nada para controlarlas. Esto dificulta el aprendizaje ya que
la falta de control sobre la situacin hace que descienda la motivacin de los sujetos para
realizar una respuesta instrumental. No confundir con el efecto de indefensin aprendida
que explica el patrn de resultados obtenido con el diseo tridico.

3. Deficit de actividad: Las ratas del Grupo A aprendan a ser inactivas en respuesta a la
descarga durante la fase de exposicin.

Principios de Aprendizaje y
conducta
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL FUNDAMENTOS

4. Deficit atencional: Una descarga inescapable hace que los animales presten menos
atencin a sus acciones (ya que han aprendido que van a recibir la descarga hagan lo que
hagan). Sin embargo marcar la respuesta instrumental supera el dficit de indefensin
aprendida.

5.Relaciones estimulares en el condicionamiento de escape: El rasgo definitorio de la
conducta de escape es que la respuesta instrumental tiene como consecuencia la
terminacin del estmulo aversivo. Adems, la respuesta de escape tiene como resultado
claves internas de retroalimentacin de la respuesta. Hay dos:

- Claves de retroalimentacin de la terminacin de la descarga. (al comienzo de
la respuesta de escape)
- Claves de retroalimentacin de la seal de seguridad. (cuando el animal
completa la respuesta)

Estas claves contextuales llegan a convertirse en inhibidores condicionados del miedo y
limitan el miedo elicitado por las claves contextuales de la cmara experimental. Hay
mayor probabilidad que las claves contextuales de la cmara en la que se administran las
descargas queden condicionadas para elicitar miedo cuando las descargas son
inescapables.

Para finalizar y a modo de conclusin: El diseo tridico ha sido de un valor incalculable
para considerar la posible importancia de las contingencias respuesta-reforzador.
Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

En el mundo real la contingencia perfecta entre la respuesta y el reforzamiento es rara. No
siempre que pasemos muchas horas estudiando obtendremos una buena nota.

Para estudiar esta relacin tan compleja se crean los programas de reforzamiento:

Programa de reforzamiento: Programa o regla que determina la forma en que se
relacionan las presentaciones del reforzador con las ocurrencias de la respuesta
instrumental. La entrega del reforzador puede depender de varios factores, nmero de
respuestas, paso del tiempo, etc.

Los programas de reforzamiento se investigan normalmente en cajas de Skinner que
permiten una observacin continua de la conducta, por lo que pueden observarse y
analizarse los cambios en la tasa de respuesta. Proporcionan ms informacin sobre los
factores que controlan el mantenimiento de la conducta.

A) PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE

Son programas en los que un solo factor determina qu ocurrencia de la respuesta
instrumental se refuerza.

Programas de razn

El reforzamiento depende del nmero de respuestas.

Reforzamiento continuo: Una sla respuesta provoca la entrega del reforzador.

Reforzamiento parcial o intermitente: La respuesta se refuerza slo alguna vez.

Razn fija: Entrega del reforzador cada X respuestas, (5, 10 etc). Se representa mediante
RF5, RF10, etc.

Otros conceptos importantes

Registro acumulativo de la conducta: Es una forma especial de representar la forma de
repetirse una respuesta a lo largo del tiempo. Se utilizaba sobre todo antes de la existencia
de los ordenadores. (grfico pg 165). La pendiente de la lnea trazada representa la tasa
de respuesta.

Pausa posreforzamiento: Es la tasa de respuesta 0 que se observa justo despus del
reforzamiento.

Carrera de la razn: La tasa de respuesta alta y estable que completa cada requerimiento
de la razn.

Qu ocurre cuando el requerimiento de la razn se incrementa un poco? Es decir,
pasar por ejemplo de RF 120 a RF 150

- Con mayores requerimientos de la tasa, tienen a ocurrir pausas posreforzamiento
ms largas.
Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

- Si el incremento es muy grande (de RF120 a RF500), es probable que el animal
realice una pausa peridica cada vez que complete la razn requerida. Es lo que se
conoce como tensin de razn.

Razn variable: Nmero de respuestas distinto para la entrega del reforzador. Se
representa por RV y en el caso de RV10 quiere decir que su media es 10 (imaginemos que
en un primer ensayo se necesitaban 13 respuestas, en un segundo ensayo 7 respuestas y
en el ensayo final 10 respuestas. La media total de los 3 ensayos es RV 10.

Las pausas predecibles en la tasa de respuesta son menos probables con los programas
de razn variable que con los programas de razn fija. Los organismos suelen responder a
una tasa claramente estable en los programas de RV.

Programas de intervalo

Cuando ocurre cierta cantidad de tiempo desde la ltima entrega del reforzador.

Intervalo fijo (IF): El tiempo no vara de una ocasin a la siguiente.

Festn del intervalo fijo: A medida que el tiempo para la disponibilidad del prximo
reforzador se acerca, la tasa de respuesta aumenta. Este aumento en la tasa de respuesta
se manifiesta como una aceleracin en el registro acumulativo hacia el final del IF. Esto
demuestra una habilidad del sujeto para contar el tiempo.

OJO!!! : Un programa de IF no garantiza que el reforzador se proporcionar a en algn
momento a lo largo del tiempo, el intervalo determina slo cundo el reforzador estar
disponible, no cuando se entrega. Es decir, adems del paso del tiempo, sigue siendo
necesaria algn tipo de respuesta por parte del sujeto para acceder al reforzador. Por
ejemplo, cada 4 minutos estar disponible comida para la paloma siempre y cuando haya
dado 20 picotazos previamente.

Intervalo variable (IV): El tiempo vara de una ocasin a la siguiente. Se representa por
(IV 5), (IV 10), etc. Entendiendo este nmero como la media de todos los intervalos, de la
misma manera que hablbamos ms arriba de la razn variable.

Los programas de IV mantienen tasas de respuesta constantes y estables sin pausas
regulares. (al igual que los programas de razn variable)

Programas de intervalo y espera limitada: Esto tiene relacin con el OJO!! que marcaba
antes. En la espera limitada el reforzador est disponible durante un tiempo X, si pasado
ese tiempo el sujeto no ha dado el nmero de respuestas necesario, el reforzador deja de
estar disponible. Siguiente el ejemplo anterior, cada 4 minutos estar la comida disponible
durante 1 minuto. Si durante ese minuto de disponibilidad de la comida (+ los 4 minutos
anteriores de cada intervalo) la paloma no ha llegado a 20 picotazos no podr acceder a
ella y dejar de estar disponible, comenzando a contar de 0.






Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

Comparacin de los programas de razn y de intervalo

Similitudes

Razn fija e intervalo fijo:
- Producen una pausa posreforzamiento despus de la administracin de cada reforzador.
- Producen altas tasas de respuesta antes de la administracin del siguiente reforzador.

Razn variable e intervalo variable:
- Mantienen tasas estables de respuesta, sin pausas predecibles.

Diferencias

- Activan diferentes cambios neuroqumicos en el cerebro
- Los programas de intervalo estn relacionados con el sentido temporal del
organismo.

En un experimento con palomas, una reforzada con RV y la otra con IV, se comprob que
la paloma reforzada con el programa de RV respondi a una tasa mucho ms alta que la
paloma reforzada con el programa de IV. El programa de RV motiv una conducta
instrumental mucho ms vigorosa.

Reforzamiento diferencial del tiempo interrespuesta: El intervalo entre una respuesta y
la siguiente se denomina tiempo interrespuesta o TIR. Un sujeto que produce TIR cortos
responder a una tasa alta y si produce TIR largos, su tasa ser baja.

Un programa de razn favorece los TIR cortos (es la respuesta del sujeto la que determina
cuando acceder a la comida, por lo tanto cuanto ms rpida se produzca esa respuesta
(TIR corto), antes acceder a la comida. Por el contrario, un programa de intervalo
favorece los TIR largos.

Programas de reforzamiento de tasas de respuesta

Los programas de tasas de respuesta requieren especficamente que el organismo
responda a una tasa particular para obtener el reforzador. Es como una mezcla de los dos
anteriores (tiempo y nmero). Por ejemplo un programa de reforzamiento en el que una
respuesta se refuerce slo si ocurre dentro de los 5 segundos siguientes a la respuesta
precedente. Si el animal realiza una respuesta cada 5 segundos, su tasa de respuesta ser
de 12 por minuto. Por lo tanto habr reforzamiento si la tasa de respuesta es de 12 por
minuto o mayor. Si la tasa de respuesta es menor, el organismo no ser reforzado. Esto
recibe el nombre de Reforzamiento diferencial de tasas altas, o RDA.

Reforzamiento diferencial de tasas altas (RDA): Una respuesta se refuerza slo si
ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta
precedente. Estos programas fomentan que los sujetos respondan rpidamente.

Reforzamiento diferencial de tasas bajas (RDB): Una respuesta se refuerza slo si
ocurre despus de que haya transcurrido cierta cantidad de tiempo tras la respuesta
precedente. Estos programas fomentan que los sujetos respondan lentamente.


Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

B) CONDUCTA DE ELECCIN: PROGRAMAS CONCURRENTES

Los experimentos en los que slo se mide una respuesta (los vistos hasta ahora) no
proporcionan una visin completa de la conducta. En la vida real los organismos ocupan si
tiempo en muchas actividades y estn continuamente estableciendo elecciones entre
varias conductas.

Las situaciones de eleccin pueden ser bastante complicadas y muy diferentes. Por esta
razn los psiclogos han desarrollado el estudio de situaciones ms simples. La situacin
de eleccin ms simple consta de dos respuestas alternativas, cada una de estas seguida
por un reforzador de acuerdo con su propio programa de reforzamiento.

Histricamente se utilizaban laberintos T para estudiar la conducta de eleccin. Hoy se
utilizan cajas de Skinner equipadas con dos teclas. Responder en cada tecla es reforzado
segn algn programa de reforzamiento. Los dos programas funcionan concurrentemente,
por eso reciben el nombre de programa concurrente.

Ejemplo pgina 173 (grfico). Programa concurrente. Los picotazos sobre la tecla A siguen
un programa IV 60 seg. Los de la tecla B siguen un programa RF 10. El objetivo del
experimento es ver cmo la paloma distribuye sus picotazos en las dos teclas y cmo
influye el programa de reforzamiento propio de cada tecla en las elecciones del animal.

Medidas de la conducta de eleccin

Se puede medir de varias formas:

Tasa relativa de respuesta de cada alternativa: La tasa relativa de respuesta en la tecla
A se calcula dividiendo la tasa de respuesta en la tecla A por la tasa total de respuesta
(suma de la tasa A + la tasa B)

Tasa relativa de respuesta (A) = R
A
/ (R
A
+R
B
)

- Si la paloma picotea igualmente en las dos teclas de respuesta, la razn ser 0,5.
- Si la tasa de respuesta es mayor en A que en B, la razn ser mayor que 0,5.
- Si la tasa de respuesta es menor en A que en B, la razn ser menor que 0,5.

La forma en que un organismo distribuye su conducta entre las dos alternativas de
respuesta est muy influida por el programa de reforzamiento que funciona para cada
respuesta.

Tasa relativa de reforzamiento: Es la frecuencia con la que el individuo obtiene
recompensas en cada lado. Se calcula de igual manera a la tasa relativa de respuesta.
(pero con una r minscula)

Tasa relativa de reforzamiento (A) = r
A
/ (r
A
+r
B
)






Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

La ley de igualacin (de Herrnstein)

En el punto anterior (medidas de la conducta de eleccin) en los ejemplos se utilizaba el
mismo programa de reforzamiento (IV 60 seg) para las dos teclas. Por lo tanto la tasa
relativa de respuesta y la tasa relativa de reforzamiento daba 0,5 ya que los programas
eran iguales Pero qu ocurre si los programas son diferentes?

Experimento en palomas:
Tecla A: IV 6 min = Pulsando siempre a esta tecla obtendra un mximo de 10 reforzadores
por hora.
Tecla B: IV 2 min= Pulsando siempre a esta tecla obtendra un mximo de 30 reforzadores
por hora.

Cmo fue la respuesta de las palomas?
La tasa relativa de respuesta en una alternativa dada estaba siempre muy cercana a
igualar la tasa relativa de reforzamiento logrado en esa alternativa. Si las palomas obtenan
una proporcin mayor de reforzadores en A, picoteaban ms en A. Por lo tanto, la tasa
relativa de respuesta en una alternativa se iguala con la tasa relativa de reforzamiento en
esa alternativa. Esto es la ley de igualacin.

R
A
/ (R
A
+R
B
) = r
A
/ (r
A
+r
B
)

Otra forma de escribir esta frmula es: R
A
/ R
B
= r
A
/r
B


Infraigualacin, supraigualacin y sesgo de respuesta

A pesar de lo que hablbamos de la ley de igualacin, las tasas relativas de respuesta no
siempre se igualan con exactamente con las tasas relativas de reforzamiento.

Esto lo vamos a estudiar aadiendo dos parmetros b y s a la ecuacin.

R
A
/ R
B
= b (r
A
/r
B
)
s

s= sensibilidad de la conducta de eleccin a las tasas relativas de reforzamiento para las
alternativas de respuesta.

Si s es menor que 1,0 = infraigualacin. Sensibilidad reducida a la tasa relativa de
reforzamiento.
Si s es mayor que 1,0 = supraigualacin. Sensibilidad aumentada a la tasa relativa de
reforzamiento.

La infraigualacin se encuentra ms a menudo que la supraigualacin.

b = sesgo de respuesta(bias en ingls, por eso la b)
Los sesgos de respuesta influyen en la eleccin cuando las alternativas de respuesta son
diferentes (picotear y presionar con la pata). El sesgo tambin adquiere importancia
cuando el reforzador es diferente (grano de trigo y semillas).

En ausencia de sesgos, b=1. Dependiendo de la naturaleza del sesgo o de la preferencia,
b ser mayor o menor que 1.

Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

La ley de la igualacin y el valor del reforzador: La tasa relativa de respuesta es una
funcin de la cantidad relativa de cada reforzador, de la demora y de la palatabilidad.
Cuanto mayores, ms sabrosos y ms inmediatos sean los reforzadores, sern de mayor
valor.

La ley de la igualacin y los programas simples de reforzamiento: Incluso las
situaciones de respuesta nica pueden involucrar una eleccin entre realizar la respuesta
especificada (picotear o presionar una palanca) u ocuparse de otras actividades (caminar,
acicalarse, etc)

Segn esto, la ley de la igualacin quedara as:

R
A
/ (R
A
+R
O
) = r
A
/ (r
A
+r
O
)

Despejando R
A
= R
A
=(R
A
+R
O
) r
A
/ (r
A
+r
O
)

R
A
= Tasa de respuesta del programa
R
O
= Tasa de respuesta de las otras actividades
r
A
= Reforzamiento explcito del programa
r
O
= Reforzamiento de las otras actividades

Y para liar un poco ms las cosas

Si consideramos que (R
A
+R
O
) es una constante que no guarda relacin con el reforzador,
podemos llamarla constante k. La frmula quedar de la siguiente manera:

R
A
= kr
A
/ (r
A
+r
O
)

Esta ltima ecuacin proporciona dos maneras de modificar la tasa de una respuesta:

- Mediante el cambio de su tasa de reforzamiento
- Mediante el cambio de la tasa de las otras fuentes de reforzamiento


Mecanismos de la ley de la igualacin

3 mecanismos:

1. Maximizacin molecular
2. Maximizacin molar
3. Mejoramiento

Antes de entrar en detalle con cada uno de ellos. Vamos a explicar un concepto importante
para entender el 1 y el 2:

Igualacin y maximizacin de las tasas de reforzamiento: Los organismos distribuyen
sus acciones entre las alternativas de respuesta para recibir la mxima cantidad posible de
reforzadores en cada situacin.

Y ahora s, pasamos a explicar cada uno de los mecanismos:

Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

1. Maximizacin molecular: Los organismos siempre eligen cualquier alternativa de
respuesta con mejores probabilidades de que sea reforzada en ese momento.
Experimento en palomas con dos teclas (A y B) y programa IV-IV. Cuanto ms tiempo
permanezca la paloma en la tecla A, ms probabilidad habr de que transcurra el intervalo
para la tecla B y que por lo tanto el reforzamiento est disponible para B.

2. Maximizacin molar: El organismo distribuye sus respuestas entre las varias
alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la larga. Se
utiliz para explicar los programas de razn en los que los organismos rara vez cambian
de alternativa, simplemente responden a la alternativa que requiera menor nmero de
respuestas (RF10 frente a RF20)

Sin embargo la maximizacin molar encuentra problemas a la hora de explicar la
conducta de eleccin en programas de intervalo (IV-IV) y para programas razn-intervalo
(RF-IV).

3. Mejoramiento: Los mecanismos de mejoramiento operan a una escala temporal de las
teoras molas y molecular. El trmino mejoramiento se refiere a hacer algo mejor que el
pasado reciente. No se refiere a elegir la mejor alternativa en ese momento.

Trmino importante sobre el mejoramiento:

Tasa local de respuesta y reforzamiento: Las tasas locales estn calculadas slo sobre el
perodo de tiempo que un sujeto dedica a una alternativa particular de respuesta. Si la
situacin incluye dos opciones (A y B), la tasa local de respuesta en A se calcula
dividiendo la frecuencia de respuesta en A por el tiempo que el sujeto dedica a responder
en A.

Ejemplo numrico (que siempre ayudan)

- Un organismo da 75 respuestas en 20 minutos en la alternativa A
- La tasa global en A ser de 75 respuestas/hora (puede que el resto del tiempo se
haya dedicado a responder en B)
- Sin embargo la tasa local en A sera de 225 respuestas/hora (75 cada 20 minutos)

La teora del mejoramiento asume que los organismos cambian de una alternativa de
respuesta a otra para mejorar la tasa local de reforzamiento que estn recibiendo. El
mecanismo de mejoramiento da como resultado la igualacin.

Esta teora sostiene que un organismo cambiar su preferencia en favor de la alternativa
de respuesta que arroje la tasa local de reforzamiento ms alta.

C) ELECCIN CON COMPROMISO

En nuestra vida diaria, en ocasiones elegir una alternativa hace que otras no estn
disponibles. De igual forma, las elecciones importantes en la vida a menudo implican un
beneficio pequeo a corto plazo frente a un beneficio ms demorado pero mayor.

Es complicado extrapolar este tipo de decisiones al laboratorio para poder estudiarlas, por
ello los cientficos han desarrollado el programa concurrente encadenado de
reforzamiento.
Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

Programa concurrente encadenado (grfico pg 183)

Este programa involucra al menos dos fases o eslabones:

1 fase: Eslabn de eleccin: Se permite al participante elegir entre dos programas
alternativos realizando una de dos respuestas.

2 fase: Eslabn terminal: Una vez que el participante ha elegido uno de los dos
eslabones de eleccin, ir al eslabn terminal que est formado por dos programas de
reforzamiento dependiendo de qu opcin haya escogido en la 1 fase. (esto es como lo
que comentbamos antes de la vida real, en ocasiones elegir una opcin hace que otras
opciones no estn disponibles)

Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de razn
variable (RV) ya que proporciona reforzamiento por un nmero relativamente pequeo de
respuestas.

El estmulo del eslabn terminal se convierte en un reforzador condicionado. Por lo tanto
un programa concurrente se caracteriza en que las respuestas al eslabn inicial se
refuerzan por la presentacin de un reforzador condicionado. Las diferencias en el valor
del reforzador condicionado determinarn entonces la tasa relativa de cada respuesta de
eleccin en el eslabn inicial. (el programa (eslabn terminal) que suscite ms valor a la
paloma ser el que elija al principio en el eslabn de eleccin)

Estudios de autocontrol

El autocontrol a menudo supone elegir una recompensa grande demorada en lugar de
una recompensa pequea inmediata.

Experimento en palomas: (grfico pg 185)

Utilizando el programa concurrente encadenado. En cada uno de los programas
terminales responder era recompensado o bien mediante el acceso a una pequea
cantidad de grano (alternativa A) o el acceso a una mayor cantidad de grano que estaba
demorada 4 segundos (alternativa B).

Estudiaron la conducta de eleccin en dos circunstancias diferentes:

1. Procedimiento de eleccin directa: (dibujo superior de la 185). No existe
eslabn de eleccin, directamente se accede a la recompensa. En este ejemplo
las palomas no mostraban autocontrol y directamente seleccionaban la
recompensa pequea inmediata.

2. Procedimiento concurrente encadenado (dibujo inferior de la pgina 185, la foto
de la tia no, sino el de la paloma). En este ejemplo, los componentes terminales
estaban demorados despus de que las palomas realizaran su eleccin inicial. Si
la demora era suficiente antes de los componentes terminales, las palomas
mostraban autocontrol y elegan la recompensa grande demorada.

Conclusiones: (este prrafo lo copio tal cual del libro sin resumir porque me parece
interesante e importante): Las preferencias cambian a favor de cualquier recompensa
Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

grande demorada si se requiere que los participantes esperen ms tiempo para recibir
cualquier recompensa tras realizar su eleccin. Si las recompensas se entregan
rpidamente tras una respuesta de eleccin, los sujetos generalmente prefieren una
recompensa pequea inmediata ms que una recompensa grande demorada. Sin
embargo, si se aade una demora constante a la entrega de ambas recompensas, es
ms probable que los individuos muestren autocontrol y prefieran la recompensa grande
demorada.

Explicaciones del autocontrol:

El valor de un reforzador se reduce en funcin del tiempo que haya que esperar para
obtenerlo. La funcin matemtica que representa esto se llama funcin descontadora del
valor.
V = M / (1+KD) (esta funcin recibe el nombre de funcin del
decaimiento hiperblico)

V= valor del reforzador
M= Magnitud de la recompensa
D= Demora de la recompensa
K= Parmetro de la tasa descontadora

Si el reforzador es entregado sin demora (D=0), el valor del reforzador estar
directamente relacionado con su magnitud. Cuanto ms se demora el reforzador menor
es su valor.

La funcin descontadora del valor explica el problema del autocontrol en el grfico de la
pgina 186. Me ha costado un poco entenderlo pero es bastante sencillo. Tenemos una
lnea horizontal que es el tiempo y una vertical que es el valor de la recompensa.
Tambin tenemos 2 momentos en el tiempo (T1 y T2). Dependiendo de qu momento
escojamos elegiremos una recompensa u otra. As por ejemplo en T1 vemos que la lnea
que lleva a la recompensa pequea est por encima (tiene ms valor) que la lnea que
lleva a la recompensa grande. Por lo tanto en T1 escogeremos la recompensa pequea.
Por el contrario en T2 la lnea que lleva a la recompensa grande est por encima y
escogeremos esta opcin. La opcin T2 es la opcin de autocontrol

Las funciones descontadotas y los problemas de autocontrol en la adiccin a la
droga:

Cuando ms acusada sea la funcin descontadora de la demora de una persona, ms
dificultad tendr para mostrar autocontrol (seleccionando una recompensa mayor
demorada) en lugar de impulsividad (seleccionando una recompensa ms pequea pero
ms rpida).

Experimentos para medir el autocontrol en personas dependientes de la herona
demostr que tenan ms impulsividad que el resto de las personas. (grfico de la
izquierda en 187). Para los dependientes de la herona, el valor del dinero (con el que se
realizaba el experimento) disminuy muy rpido si iban a tardar en drselo.




Principios de Aprendizaje y conducta
CAPITULO 6: PROGRAMAS DE REZORZAMIENTO Y CONDUCTA DE ELECCIN

Puede entrenarse el autocontrol?

La respuesta es s.

Ejemplo con nios. 3 fases.

Fase 1- Pretest: Se les pregunta a los nios si quieren 2 centimos ahora o 3 centimos al
final del da. A los que eligen los 2 cntimos se les dan enseguida, a los que eligen los 3
centimos se les dan al final del da.

Fase 2- Sesin de entrenamiento: Dependiendo de la eleccin en la fase 1, se hacen 2
grupos y se comienza con la sesin de entrenamiento. Deben resolver problemas
sencillos para obtener la recompensa, las respuestas correctas del grupo de los 2
cntimos recibirn el dinero al instante. Las respuestas correctas del grupo de los 3
cntimos recibirn el dinero al final del da.

Fase 3 Postest: se les vuelve a preguntar a los nios lo mismo que en la fase 1.

El hallazgo fue que haba mayor cantidad de nios escogiendo la recompensa ms
grande demorada (3 cntimos) en el postest. Por lo tanto, siempre y cuando las tareas de
entrenamiento (fase 2) impliquen bajo esfuerzo, el entrenamiento con la recompensa
demorada incrementar la preferencia por la recompensa ms grande demorada.

Todo esto del autocontrol lo encuentro bastante relacionado con alguno de mis artculos:

- Voluntad vs Hbito: el desafo de los 30 das (21 Octubre 2009)
- Cmo aumentar tu autodisciplina (26 y 30 Octubre 2009)
Psicologa del Aprendizaje
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Un sujeto est motivado para obtener un reforzador. Pero qu significa estar motivado?

Existen dos perspectivas que intentan dar solucin a este problema:

1. Estructura asociativa del condicionamiento instrumental: (Thorndike). Toma una
perspectiva molecular. Se centra en las respuestas individuales y sus antecedentes
estimulares y consecuencias especficas.

2. Regulacin conductual: (tradicin skinneriana): El condicionamiento instrumental se
considera desde un contexto ms amplio, es decir, desde una perspectiva molar. Se
analizan las opciones conductuales del organismo para alcanzar las metas, por lo tanto
es una perspectiva ms funcional.

Y ahora vamos a ver cada una de las dos en mayor profundidad

1.ESTRUCTURA ASOCIATIVA DEL CONDICIONAMIENTO
INSTRUMENTAL

Thorndike: El condicionamiento instrumental incluye algo ms que una respuesta y un
reforzador. Deben considerarse 3 sucesos en el anlisis del condicionamiento instrumental:

- Contexto estimular (E)
- Respuesta instrumental (R)
- Consecuencia de la respuesta o reforzador (C)

Estos 3 sucesos se relacionan entre s creando distintos tipos de relaciones que vamos a ver a
continuacin.

La asociacin E-R y la ley del efecto

El papel del reforzador (C) es establecer una asociacin entre las claves contextuales (E) y la
respuesta instrumental (R).

La ley del efecto asume que el nico papel del reforzador es crear una asociacin E-R, ya que
el reforzador (C) no participa en esta asociacin.

Expectativa de recompensa y la asociacin E-C

Los procesos pavlovianos son importantes en este tipo de asociacin. El reforzamiento de la
respuesta (R) producir una asociacin entre el contexto estimular (E) y la consecuencia de la
respuesta (C).

Hull estableci que la respuesta instrumental era motivada por dos factores:

a) (E) evoca la respuesta directamente por asociacin con (R)
b) La actividad instrumental tambin llega a realizarse en respuesta a la expectativa de
recompensa debido al establecimiento de una asociacin R-C.

La teora moderna de los dos procesos: Esta teora asume que hay 2 tipos de aprendizaje,
el condicionamiento pavloviano y el instrumental y estn relacionados de una forma especial:
Psicologa del Aprendizaje
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Durante el condicionamiento instrumental, (E) se relaciona con (C) a travs de
condicionamiento pavloviano. Entonces tenemos la asociacin (E-C). A travs de esta
asociacin, (E) motiva la conducta instrumental mediante la activacin de un estado
emocional central que depender de la naturaleza del reforzador (como puede ser la
esperanza de obtener comida).

Entonces dieron un paso ms

Cmo podan demostrar que este estado de esperanza finalmente motivara la conducta
instrumental? La tasa de una respuesta instrumental ser modificada por la presentacin de un
estmulo clsicamente condicionado. Reforzar una presin de palanca con comida crea la
expectativa de comida y la emocin de esperanza. Por lo tanto la presentacin de un EC+
clsicamente condicionado con comida durante la ejecucin de una respuesta reforzada
debera aumentar la esperanza y por lo tanto incrementar la respuesta.

Resultados consecuentes con la teora moderna de los dos procesos

Experimento de transferencia de control: (consta de 3 fases)

Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algn
procedimiento de reforzamiento positivo o negativo.
Fase 2: Se entrena a los participantes con un condicionamiento clsico en el cual se asocia un
EC explcito con la presencia o ausencia de un estmulo incondicionado.
Fase 3: Es la fase de transferencia crtica. Se permite a los participantes que realicen la
respuesta instrumental y se presenta el EC de la fase 2 para comprobar su efecto en la tasa de
conducta instrumental.

Interacciones de respuesta en los experimentos de transferencia de control

Un estmulo clsicamente condicionado puede influir sobre la conducta instrumental a travs de
las respuestas abiertas que elicita. Situacin hipottica: Un estmulo condicionado clsicamente
hace que un animal permanezca quieto y su respuesta instrumental es saltar hacia delante y
hacia atrs. La consecuencia es que el EC disminuir la respuesta instrumental y saltar
menos.

Estados emocionales centrales condicionados o expectativas especficas de
recompensa?

En ciertas circunstancias los animales adquieren expectativas especficas del reforzador en
lugar de un estado emocional ms general de esperanza durante el condicionamiento
instrumental y clsico.

Relaciones R-C y E(R-C) en el condicionamiento instrumental

En los dos tipos de asociaciones que hemos visto antes (Throndike E-R y asociacin E-C) no
se inclua de forma directa una relacin entre la respuesta (R) y el reforzador (C). Esto es
importante ya que de forma informal nosotros responderamos que estamos realizando una
determinada conducta (R) para conseguir una determinada consecuencia o reforzador (C), sin
embargo ninguno de los dos modelos contempla est asociacin directa R-C.


Psicologa del Aprendizaje
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

Evidencia de asociaciones R-C: Una tcnica para probar la asociacin respuesta-
consecuencia consiste en devaluar el reforzador despus del condicionamiento clsico para ver
si esto disminuye la respuesta instrumental.

La devaluacin de un reforzador debilita selectivamente la respuesta particular que ha sido
entrenada con ese reforzador.

Evidencia del aprendizaje de una relacin jerrquica E-(R-C): Las asociaciones R-C
no pueden actuar aisladamente para producir la conducta instrumental. Se necesita un
factor adicional para activar la asociacin R-C. Y este factor es el estmulo (E).


2. REGULACIN CONDUCTUAL

Los anlisis de la regulacin conductual se centran en cmo las contingencias instrumentales
ponen limitaciones a las actividades de un organismo.

Antecedentes de la regulacin conductual

Al principio se consideraba que los reforzadores eran unos estmulos especiales que fortalecan
la conducta instrumental.

La teora de la respuesta consumatoria: (Fred Sheffield)- Las respuestas consumatorias
tpicas de la especie (comer, beber, etc) son en s mismas el rasgo crtico de los reforzadores.
Se consider que las respuestas reforzadoras eran especiales porque involucraban la
consumacin o completamiento de una secuencia instintiva de conducta.

El principio de Premack: Las respuestas incluidas en los reforzadores comnmente utilizados
son actividades que es altamente probable que realicen los animales (respuesta de comer en
una rata privada de comida). Por el contrario las respuestas instrumentales son actividades que
normalmente ocurren a una baja probabilidad (respuesta de presionar una palanca).

Y a continuacin el enunciado de este principio como Dios manda:

Dadas dos respuestas de diferente probabilidad, A y B, la oportunidad para realizar la
respuesta de alta probabilidad A despus de la respuesta de baja probabilidad B tendr
como resultado el reforzamiento de la respuesta B. La oportunidad para realizar la
respuesta B de baja probabilidad despus de la respuesta A de alta probabilidad no dar
como resultado el reforzamiento de la respuesta A

!
(B "A refuerza B)
!
(A "B no refuerza A)

Comer reforzar la presin de la palanca porque comer es normalmente ms probable que
presionar la palanca. Sin embargo, la presin de la palanca no puede reforzar el comer.

Por todo esto, el principio de Premack tambin recibe el nombre de principio de la
probabilidad diferencial.



Psicologa del Aprendizaje
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

En resumen: El principio de Premack signific un avance importante en el pensamiento
cientfico sobre el reforzamiento. Estimul la consideracin de los reforzadores como
respuestas ms que como estmulos. Con este principio cualquier actividad poda servir
como reforzador siempre y cuando fuera ms probable que la respuesta instrumental.


La Hiptesis de la privacin de respuesta: (Timberlake y Allison): La restriccin de la
respuesta reforzadora es el factor crtico para el reforzamiento instrumental. Incluso el
acceso a una respuesta de baja probabilidad puede servir como reforzador siempre y
cuando los sujetos tuvieran la restriccin de realizar esa respuesta.

Por lo tanto esto entra en conflicto con el principio de Premack al mostrar que la privacin
de respuesta es ms bsica para la motivacin de la conducta instrumental que la
probabilidad diferencial de la respuesta.

Tanto la teora de Premack como la hiptesis de la privacin de respuesta sugieren que los
reforzadores no existen en sentido absoluto.

Regulacin conductual y el punto de deleite conductual

El concepto de regulacin est muy relacionado con la homeostasis. Los organismos
tienen una distribucin de actividades preferida que luchan por mantener frente a los
cambios. Si se perturba este nivel de actividades ptimo, se supone que la conducta
cambiar para regular la desviacin.

Punto de deleite conductual: Si los organismos son libres para distribuir sus respuestas
entre varias alternativas, lo harn de forma en que sea ms cmodo para ellos. Este punto
puede identificarse mediante la frecuencia relativa de ocurrencia de todas las respuestas
de un organismo en una situacin sin restricciones. (grfico pg 205)

Imposicin de una contingencia instrumental: (seguimos observando el grfico de la
205) La contingencia consiste en un programa mediante el cual se le pide al estudiante que
estudie la misma cantidad de tiempo que dedica a ver la television. (es la lnea que parte
del origen con un ngulo de 45).

Una contingencia instrumental no permite volver al punto de deleite. Sin embargo el punto
de deleite conductual sigue teniendo importancia ya que proporciona la motivacin para la
conducta instrumental. Volver al punto conductual sigue siendo una meta en la distribucin
de respuestas.

Modelo de desviacin minima (Staddon): La introduccin de una contingencia
respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las
respuestas instrumentales y contingentes de manera que se minimice la desviacin total de
las dos respuestas con respecto al punto ptimo o de deleite. (es el punto negro de la lnea
del grfico de la pgina 205)

Explicacin de los efectos del reforzamiento: El efecto de reforzamiento se identifica
por un incremento en la ocurrencia de una respuesta instrumental sobre el nivel de esa
conducta en ausencia de la contingencia respuesta-reforzador. Siguiendo con el ejemplo
del estudiante, para acercarse al punto de deleite conductual, el estudiante tiene que
Psicologa del Aprendizaje
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

aumentar su estudio para obtener ms oportunidad de ver la television. Y al aumentar el
estudio se produce el reforzamiento que es lo que buscamos.

Una vision sobre las contingencias de reforzamiento en un contexto conductual ms
amplio: El contexto tambin influye en todo esto ya que las contingencias instrumentales
no suceden en un vaco, ocurren en un contexto en el que se puden dar una variedad de
respuestas y reforzadores. Si el estudiante prefiere escuchar la radio en lugar de ver la TV,
no aumentar su conducta de estudio como para conseguir su cantidad de tiempo
preferida de TV. Y ahora nos van a relacionar todo esto con la economa

Conceptos econmicos y distribucin de respuesta

La economa es el estudio de la distribucin de la conducta dentro de un sistema de
restricciones

Economa: Las restricciones de la conducta se imponen por los ingresos de un individuo y
el precio de los bienes que se quiere obtener.

Psicologa: En las situaciones de condicionamiento instrumental, las restricciones estn
proporcionadas por el nmero de respuestas que un organismo es capaz de realizar y el
nmero de respuestas requerido para obtener el reforzador.

Demanda del consumidor: Es fundamental la relacin entre el precio de una comodidad y
cunto se obtiene, esto se denomina curva de la demanda

Elasticidad de la demanda: Grado en el cual el precio influye en el consumo. La demanda
de caramelos es mu elstica, quiere decir que conforme ms suba el precio de los
caramelos ms descender su compra. (grfico pg 209)

Y cmo relacionamos todo esto con el reforzamiento instrumental?: ESTABLECIENDO
ANALOGAS.

- El nmero de respuestas (o tiempo dedicado a responder) es el dinero.
- El precio de un reforzador es el tiempo o nmero de respuestas requeridas para
obtener (adquirir) el reforzador.

La meta es comprender cmo la conducta instrumental (gasto) est controlada por las
contingencias instrumentales (precios).

Determinantes de la elasticidad de la demanda: Existen 3 factores que influyen en cmo
las restricciones de un programa moldean la redistribucin de la conducta:

1. Disponibilidad de sustitutos: El grado en que los aumentos en el precio de un artculo
producen una disminucin en el consumo depende de la disponibilidad (y precio) de otros
bienes que puedan utilizarse en sustitucin del artculo original. La disponibilidad de
sustitutos aumenta la sensibilidad del artculo original a los precios altos. Si algo aumenta
de precio y yo tengo una alternativa, dejar de comprarlo rpidamente y adquirir la
segunda alternativa. (el caf es sustituto del te ya que ambos contienen cafeina).

- Economa abierta: A los animales se les da comida fuera de las sesiones
experimentales
Psicologa del Aprendizaje
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

- Economa cerrada: Los animales no reciben alimentacin suplementaria.

2. Rango de precios: Un aumento en el precio tiene menos efecto en precios bajos que en
precios altos. En un rango de precios bajos, la demanda de comida no es elstica. (no
olvidemos que cuando hablamos de precio nos estamos refiriendo al nmero de
respuestas para obtener un reforzador).

3. Nivel de ingresos: Cuanto ms salario, menos se desanimar un consumidor con los
incrementos del precio. Extrapolando esto a los programas de reforzamiento, el nmero de
respuestas o el tiempo disponible para responder corresponde a los ingresos, por lo tanto
cuantas ms respuestas o tiempo tengan disponibles los animales, menos estar su
conducta influida por los aumentos en el coste del reforzador.


Problemas con las aproximaciones de regulacin conductual

- El punto de deleite es una caracterstica molar de la conducta. Se basa en una
medida de cada respuesta acumulada a lo largo de un bloque temporal amplio. En
el ejemplo del nio que estudiaba y vea TV, el punto de deleite lo poda haber
alcanzado viendo todo el tiempo la TV antes de estudiar o alternando ambas
respuestas. Desde la aproximacin punto de deleite conductual no importa que
estrategia utilizara, sin embargo s que es importante desde el punto de deleite
molar.

- Otro problema es que las respuestas durante un perodo de lnea de base libre no
siempre tienen el mismo valor como respuestas que ocurren como parte de una
contingencia instrumental impuesta. Es decir, debemos asumir que estudiar en
ausencia de una restriccin de respuesta impuesta externamente tiene que tener el
mismo valor que estudiar para obtener acceso a la TV. Sin embargo esto es
incorrecto, correr por placer es diferente que cuando se requiere por una
contingencia instrumental impuesta (correr en una clase de gymnasia).

- La regulacin conductual no estudia los procesos conductuales moleculares, por lo
tanto no dice nada acerca de cmo los organismos defienden una combinacin
preferida de bienes o actividades.

Contribuciones de la regulacin conductual

1. La regulacin conductual y el principio de Premack nos alej de la consideracin de
los reforzadores como tipos especiales de estmulos o como tipos especiales de
respuestas.
2. Los procedimiento de condicionamiento instrumental ya no se considera que
estampan o fortalecen la conducta instrumental, en su lugar es visto como una
nueva distribucin de respuestas.
3. No existe una distincin fundamental entre las respuestas instrumentales y las
reforzadoras. Se distinguen nicamente por los papeles asignados a ellas mediante
un procedimiento de condicionamiento instrumental.
4. La regulacin conductual y la economa conductual aceptan la idea de que los
organismos responden para maximizar sus beneficios
Psicologa del Aprendizaje
CAPITULO 7: COND. INSTRUMENTAL: MECANISMOS MOTIVACIONALES

5. La regulacin conductual y la economa conductual han proporcionado caminos
nuevos para describir las restricciones que imponen varios procedimientos de
condicionamiento instrumental en el repertorio de conducta de un organismo.


3. COMENTARIOS FINALES

En este apartado se realiza una comparacin a nivel general entre el punto 1 y el 2 de este
tema, es decir, la estructura asociativa y la regulacin conductual.

Caractersticas propias de cada teora que no comparte con la otra

Asociacionismo
- Concepto de asociacin
- Exploracin de los circuitos neuronales
- Nivel molecular: El objetivo son los estmulos especficos, las respuestas y sus
conexiones.
- Est relacionada con procesos especficos (asociaciones E-R, E-C, R-C, etc)


Regulacin conductual
- Concepto de regulacin conductual (puntos de deleite y restricciones del programa)
- Poca aplicacin neurolgica
- Nivel molar de agregados de conducta.
- Est relacionada con metas a largo plazo
Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Respondemos de distinta manera dependiendo del estmulo que se nos presente. La
supervivencia de los animales depende de su habilidad para responder apropiadamente a
la situacin.

1. IDENTIFICACIN Y MEDIDA DEL CONTROL POR EL ESTMULO

Cmo podemos afirmar que una respuesta instrumental est bajo el control de ciertos
estmulos?

Respuesta diferencial y discriminacin de estmulos

Experimento en palomas: Reforzamiento consistente en picotear un tringulo rojo con
fondo rojo. Cuando la paloma aprendi a picotear de forma estable el tringulo con fondo
rojo se separaron los estmulos (por un lado el tringulo y por otro el fondo rojo) y se midi
la respuesta en cada uno de ellos. El resultado fue que picoteaba mucho ms el fondo rojo
que el tringulo. Por lo tanto decimos que el fondo rojo controla la conducta de picoteo
mejor que el tringulo.

Otro concepto importante aqu es el de discriminacin de estmulos: Un organismo
muestra discriminacin de estmulos si responde de forma diferente a dos o ms estmulos.

En realidad al hablar del control y de la discriminacin estamos hablando de lo mismo pero
desde diferentes puntos de vista. Uno no existe sin lo otro. Adems, en ausencia de
procedimientos especiales, los investigadores no siempre pueden predecir cul de varios
estmulos de aquellos que un organismo experimenta adquirir control sobre su conducta
instrumental.

Generalizacin de estmulos

Se dice que un organismo muestra generalizacin de estmulos si responde de forma
similar a dos o ms estmulos. Pavlov descubri esto al observar cmo despus de utilizar
un estmulo como EC, sus perros tambin daban la respuesta condicionada a otros
estmulos semejantes.

Gradiente de generalizacin de estmulos: Experimento en Palomas: Picoteaban una
tecla de 580nm de longitud de onda, se demostr que ante variaciones de la longitud entre
570 y 590 seguan respondiendo de la misma forma. El intervalo donde se generalizan las
respuestas (570-590) es lo que se conoce como gradiente de generalizacin del estmulo.

Los gradientes de generalizacin del estmulo como medidas del control por el
estmulo

Los gradientes facilitan informacin acerca del grado de sensibilidad de la conducta de un
organismo antes la variacin de un aspecto particular del ambiente. Los investigadores
pueden determinar exactamente el grado en que tiene que modificarse un estmulo para
producir un cambio en la conducta.

- Si un gradiente es muy plano (grfico pg 222) quiere decir que el rasgo que se
vara en la prueba de generalizacin no controla la conducta instrumental. Por
ejemplo, las palomas ciegas como no vean las diferencias en los colores, seguan
Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

picoteando de igual forma aunque el estmulo se saliese del gradiente, y por lo
tanto la lnea del gradiente es prcticamente plana.

- Por el contrario, si el gradiente es muy acusado (grfico 221) quiere decir que el
organismo responde en mayor medida a algunos estmulos de prueba que a otros.

Resumiendo: Lo acusado del gradiente de generalizacin de un estmulo proporciona
una medida precisa del grado de control del estmulo. La generalizacin y la respuesta
diferencial son fenmenos opuestos.

2. FACTORES DEL ESTMULO Y LA RESPUESTA EN EL CONTROL
POR EL ESTMULO

En el experimento de las palomas era muy fcil dividir las caractersticas del estmulo
(tringulo y fondo rojo), sin embargo en la vida real es mucho ms dificil dividir las
caractersticas ya que las situaciones son mucho ms complejas.

Por lo tantoQu es lo que determina que una de las muchas caractersticas de una
situacin estimular adquiera control sobre la conducta instrumental? Lo vamos a ver a
continuacion:

Capacidad sensorial y orientacin

La capacidad sensorial y de orientacin determinan qu estmulos se incluyen en el mundo
sensorial de un organismo. Lo que est fuera de su rango sensorial no existe para un
organismo (los seres humanos no podemos oir los ultrasonidos, sin embargo los perros s)

Facilidad relativa del condicionamiento de varios estmulos

Aparte de tener la capacidad sensorial, la intensidad con que los organismos aprenden
sobre un estmulo depende de la facilidad relativa de condicionamiento de otras claves
presentes en la situacin. Esto se conoce como ensombrecimiento. Ejemplo de un nio
que aprende a leer viendo los dibujos de un libro ignorando las frases. Luego al ir
describiendo los dibujos parecer que est leyendo cuando en realidad no es as.

Cuanto ms intenso sea el estmulo, ms rpido se condicionar y ensombrecer el
aprendizaje del estmulo ms dbil.

Tipos de reforzamiento

Es ms probable que ciertos tipos de estmulos adquieran control sobre la conducta
instrumental con reforzamiento positivo que con reforzamiento negativo.

Ejemplo en Palomas

- Reforzamiento positivo (comida) con tono y luz roja: Respondieron ms a la luz roja
- Reforzamiento negativo (descarga) con tono y luz roja: Respondieron ms al tono

Esto se puede explicar por los sistemas de conducta que se activan en cada caso. En el
caso de la alimentacin las claves visuales son ms dominantes (luz roja) mientras que en
Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

el caso de evitar el peligro son ms importantes los tonos (el animal oye a un depredador
acercarse)

Por lo tanto, para una misma combinacin de estmulos se pueden dar respuestas
diferentes dependiendo del tipo de condicionamiento empleado, debido al sistema de
conducta que se activa en cada caso.

Tipos de respuesta instrumental

Otro factor importante es el tipo de respuesta requerida para el refozamiento. En un
experimento con perros se demostr que las respuestas que se diferencian por la
localizacin (levantar la para derecha/levantar la pata izquierda) es ms probable que
estn bajo el control de la caracterstica especial de las claves auditivas. Por el contrario
las respuestas que se diferencian por la naturaleza (hacer/no hacer) es ms probable que
lleguen a estar bajo el control de la naturaleza de la clave auditiva.

Respuestas de localizacin (levantar derecha o izquierda) Localizacin clave auditiva

Respuestas de naturaleza de la accin (hacer o no hacer) Tipo de clave auditiva

Aunque esto parezca un poco complejo de entender, en realidad es bastante sencillo. El
experimento en perros que se explica en las pginas 226-228 lo deja bastante claro.

A todo este fenmeno lo llamamos: efecto de la naturaleza-localizacin

El efecto de naturaleza-localizacin es un ejemplo de asociacin selectiva. Hay otros
ejemplos de asociacin selectiva:

Claves relacionadas con el sabor Asociadas con la enfermedad
Claves audiovisuales Asociadas con descarga elctrica

Elementos del estmulo frente a claves configuracionales en los estmulos
compuestos

Aproximacin elemental del estmulo: Los distintos elementos que forman un estmulo
(localizacin, color, sonido, etc) son tratados por el organismo como rasgos distintivos y
sepadados del ambiente.

Aproximacin de la clave configuracional: (es lo contrario a lo anterior): Los estmulos
son percibidos como un todo integral y no se dividen en partes ms pequeas.

Ejemplo metafrico con una orquesta: Como aproximacin elemental sera fijarnos en
como suena la msica que emite cada integrante (flauta, clarinete, tambores, etc) y como
aproximacin configuracional sera analizar cmo suena la pieza musical en s cuando
todos la tocan al unsono.

Aunque parezcan aproximaciones opuestas, se han elaborado teoras para unificarlas. Se
piensa que en ciertas circunstancias predomina el control elemental mientras que en otras
condiciones predomina el control de las caractersticas configuracionales.


Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

3. FACTORES DE APRENDIZAJE EN EL CONTROL POR EL
ESTMULO

El hecho de que ciertos estmulos puedan percibirse no asegura que llegarn a controlar la
conducta (un nio puede ver un debate Rajoy-Zapatero y no distinguir diferencias entre
ellos). Para que ciertos estmulo lleguen a controlar la conducta, tambin depende de lo
que el organismo haya aprendido de ellos.

Pavlov: La generalizacin del estmulo se da porque el aprendizaje sobre el EC llega a
tranferirse a otros estmulos.

Lashley y Wade (contrarios a Pavlov): La generalizacin del estmulo ocurre si los
organismos no han aprendido a distinguir las diferencias entre estmulos. Por lo tanto la
generalizacin del estmulo refleja ausencia de aprendizaje.

Entrenamiento en discriminacin de estmulos

Los participantes se exponen a dos estmulos diferentes (luz roja y otra verde) pero solo se
les refuerza en uno de los dos colores.

Figura 8.7 pg 231: La luz roja seala la disponibilidad de reforzamiento para la respuesta.
La luz verde seala que la respuesta no sera reforzada.

El estmulo que seala disponibilidad de reforzamiento se denomina E+ o E
D
(e de)
El estmuo que seala la falta de reforzamiento se denomina E- o
!
E
"
(e delta)

A medida que progresa el entrenamiento, la respuesta de los organismos en presencia de
E+ aumenta mientras que la respuesta en presencia de E- declina. Cuando tanto E+ como
E- han adquirido control sobre la conducta del organismo, se llaman estmulos
discriminativos.

Programa mltiple de reforzamiento: el procedimiento de la figura 8.7 es un ejemplo de
este tipo de programa. En un programa mltiple funcionan diferentes programas de
reforzamiento en presencia de diferentes estmulos. (Por ejemplo que est funcionando un
programa de IV de reforzamiento cuando se enciende una luz y un programa de RF
cuando se presenta un tono)

Efectos del entrenamiento en discriminacin sobre el control por el estmulo

Para poder hacernos una idea de la precisin de control que el E+ adquiere sobre la
conducta instrumental no basta con solamente observar la respuesta diferencial ante E+ y
E-. Se debe tambin determinar lo acusado del gradiente de generalizacin.

Varios experimentos realizados por Jenkins y Harrison aportaron las siguientes
conclusiones:

- El entrenamiento en discriminacin aumenta el control por el estmulo de la
conducta instrumental
- Una dimensin particular del estmulo (como la frecuencia tonal) es ms probable
que adquiera control sobre la respuesta si el E+ y el E- difieren a lo largo de la
dimensin del estmulo
Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Rango de posibles estmulos discriminativos

Los procedimientos de discriminacin pueden ser utilzados para situar la conducta
instrumental de un organismo bajo el control de una amplia variedad de estmulos
(palomas aprendiendo a distinguir diapositivas de Monet y Picasso, o distinguiendo la
msica de Bach de la de Stravinsky).

Estos procedimientos se utilizan a menudo para evaluar la capacidad sensorial de los
animales.

Tambin se realizaron experimentos inyectando cocana a Palomas para ver si podan
distinguir las sensaciones internas que les provocaba esa droga. La conclusin fue que
efectivamente el entrenamiento en discriminacin s que aument el control de la conducta
por las sensaciones internas creadas por la cocana.

Qu se aprende en el entrenamiento por discriminacin?

Tenemos un E+ (luz roja) y un E- (tono intenso)

Un organismo puede aprender 3 cosas diferentes con prcticamente los mismos
resultados:

1- Responder slo ante la presencia de E+ y no aprender nada acerca de E-
2- Aprender a suprimir la respuesta durante E- pero no aprender nada acerca del E+
3- Aprender el significado tanto de E+ como de E-

Teora de Spence del aprendizaje de discriminacin

Se basa en la tercera opcin que acabamos de ver.

La mera observacin de que los organismos responden ms al E+ que al E- no es
suficiente para probar que han aprendido algo acerca de ambos estmulos. Por lo tanto
haremos experimentos donde utilizaremos los gradientes de generalizacin del estmulo.

Gradiente de generalizacin del estmulo excitatorio: Si se ha condicionado una tendencia
excitatoria al E+, debe observarse un gradiente de generalizacin acusado con la mayor
cantidad de respuesta ante el E+.

Gradiente de generalizacin del estmulo inhibitorio: Si se ha condicionado una tendencia
inhibitoria al E-, entonces los estmulos que difieran progresivamente del E- deberan ser
cada vez menos efectivos en inhibir la respuesta instrumental.

Algunos experimentos relacionados con esto muestran que el entrenamiento en
discriminacin puede producir tanto condicionamiento excitatorio al E+ como
condicionamiento inhibitorio al E-.







Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Interacciones entre el E+ y el E-: desplazamiento del mximo

Lo que se aprende el sujeto sobre el E+ puede influir en la respuesta al E- y viceversa,
sobre todo si ambos se encuentran relacionados de alguna manera.

Discriminacin intradimensional: Se produce cuando el E+ y el E- son semejantes
excepto por un rasgo o atributo.

La discriminacin intradimensional es una forma de ejecucin experta. (cuando dos cosas
son muy parecidas, hace falta ser un experto para poder captar las diferencias sutiles)

Por ejemplo, si entrenamos una luz de 500 nm como E+ y una luz de 600 nm como E-, y
luego presentamos 4 luces de 450, 490, 590 y 650 nm cmo estmulos de prueba. El
mximo de respuesta no se emite ante la luz de 490 nm (que es valor ms parecido al E+
original: 500 nm), sino ante un valor distinto en direccin opuesta al E-, en este caso: 450
nm.

Explicacin de Spence del desplazamiento del mximo: La explicacin de Spence a
este fenmeno se basa en la interaccin en forma de superposicin matemtica de los
valores absolutos de los E+ y E- originales (los que han participado en el entrenamiento).
En otras palabras, Spence considera que, independientemente de los estmulos que se
presenten en la prueba de generalizacin, es posible calcular el valor del rasgo del
estmulo hacia el que va a desplazarse el mximo de respuestas atendiendo
exclusivamente a los valores netos de los E+ y E- originales. Por ejemplo, si el E+ es una
luz de 100 nm y el E- una luz de 50 nm, puede deducirse que el mximo de respuesta se
emitir ante una luz de 150 nm, independientemente del valor que tengan en ese rasgo los
estmulos de prueba que se presenten.

Explicaciones alternativas del desplazamiento del mximo: La explicacin alternativa
asume que los organismos aprenden a responder a un estmulo basndose en la relacin
de ese estmulo con otras claves de la situacin (a diferencia del modelo de Spence que es
un modelo de aprendizaje absoluto del estmulo)

Entrenamiento de equivalencia de estmulos

De la misma forma que el entrenamiento en discriminacin potencia la respuesta
diferencial, el entrenamiento en equivalencia potencia la respuesta generalizada o
equivalencia de estmulos.

El emparejamiento de estmulos diferentes con la misma consecuencia crea equivalencia
funcional entre esos estmulos con la consecuencia de que una respuesta condicionada a
uno de ellos se generalizar a los otros.

Se dice que existe una clase de equivalencia si sus miembros poseen 3 propiedades
matemticas:

1) Reflexividad o igualdad (A=A, B=B, C=C)
2) Simetra (si A lleva a B, diremos que tambin B lleva a A)
3) Transitividad (Si A lleva a B y B lleva a C, diremos que A lleva a C)


Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

4. CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES

Estmulo discreto: Aquel que se presenta durante un breve perodo de tiempo y tiene un
comienzo y un final claros.

Sin embargo los estmulos discretos suceden en presencia de un fondo de claves
contextuales que tambin pueden proporcionar una fuente importante de informacin
acerca de la conducta aprendida.

Control por claves contextuales

Las claves contextuales pueden llegar a controlar la conducta de varias formas.

En un experimento con codornices macho, mostraban predileccin por contextos en los
que previamente se les haban presentado una hembra sexualmente receptiva. Por lo tanto
las asociacin de claves contextuales con el reforzamiento sexual aument la preferencia
por estas claves.

Este experimento muestra que las claves contextuales pueden llegar a controlar la
conducta si sirven como seal para un EI o un reforzador.

EntoncesSirven las claves conductuales para controlar la conducta cuando no sealan
ningn reforzamiento, sino que simplemente son estmulos de fondo?

En varios experimentos se concluy que efectivamente las claves contextuales (sin
reforzador) tambin pueden llegar a controlar la conducta instrumental. Adems el control
contextual por el estmulo puede ocurrir sin que un contexto est ms fuertemente
asociado con el reforzamiento que otro.

Control de las relaciones condicionales

Relaciones binarias: Son las relaciones entre dos eventos (un EC y un EI)

Modulador: En ciertas circunstancias la naturaleza de una relacin binaria est
determinada por un tercer suceso llamado modulador. (en los experimentos anteriores el
contexto ejerca de modulador)

Relacin condicional: Es la relacin de un modulador con la relacin binaria que seala.

Control condicional en el condicionamiento pavloviano: El concepto fundamental del
control condicional es que un evento seala la relacin entre otros dos eventos.

Ejemplo con EC (luz naranja) y la presentacin de comida (EI)
Establecer una relacin condicional requiere introducir un tercer suceso (modulador) que
indica cundo la presentacin de luz en la tecla terminar con comida. Podra ser un
estmulo auditivo. Los resultados muestras que los pjaros picoteaban la tecla naranja
mucho ms cuando se presentaba despus de la presentacin del modulador que cuando
se presentaba como un elemento aislado. Por lo tanto la presencia del modulador facilita la
respuesta al EC de la luz de la tecla.

Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

Un estmulo discriminativo facilita la respuesta instrumental mientras que el modulador
facilita la respuesta elicitada por el EC.

Estmulos discriminativos: Reciben este nombre los moduladores (E+ y E-) en los
procedimientos de discriminacin instrumental.

Otras terminologas:

(En el condicionamiento pavloviano)

Facilitacin: Es otro nombre con el que se conoce al control condicional de la respuesta,
debido a que el modulador facilita la respuesta al EC.

Facilitador: Otro nombre con el que se conoce al modulador.

(en el condicionamiento clsico)

Establecimiento de la ocasin: lo mismo que facilitacin

Establecedor de la ocasin: lo mismo que facilitador


Distincin entre la excitacin y la modulacin

- La extincin es un procedimiento en el cual un estmulo previamente condicionado
se presenta repetidamente pero se omite el EI. El resultado tpico de la extincin es
que disminuye la respuesta condicionada.

La diferencia en los efectos de un procedimiento de extincin sobre los estmulos
condicionados excitatorios y los establecedores de la ocasin est relacionada con lo que
se seala en cada uno de los procedimientos (y aqu es donde encontramos la distincin):

- Un estmulo condicionado excitatorio seala la prxima presentacin del EI. La ausencia
del EI despus de la presentacin del EC durante la extincin es una violacin de esa
expectativa. Por lo tanto el valor como seal del EC tiene que reajustarse en la extincin
para estar en consonancia con la nueva realidad. Un reajuste como ste no se requiere en
un procedimiento de extincin de un establecedor de la ocasin.

Por otro lado

- Un establecedor de la ocasin seala una relacin entre un EC y un EI. La
ausencia del EI cuando se presenta el establecedor de la ocasin (o modulador)
por s solo durante la extincin no significa que la relacin entre el EC y el EI haya
cambiado. En consecuencia la habilidad del modulador para promover la respuesta
elicitada por el EC permanece intacta durante la extincin.


Modulacin frente a condicionamiento configuracional: Antes veamos un experimento
con modulador (sonido) junto a un EC (luz naranja) y un EI (presetnacin de comida). Para
que el sonido sirva como una seal de que la luz de la tecla se emparejar con la comida,
el sonido y la luz de la tecla tiene que ser tratados como elementos independientes ms
Psicologa del Aprendizaje
CAPITULO 8: EL CONTROL DE LA CONDUCTA POR EL ESTMULO

que como una clave configuracional combinada. Por tanto, los efectos modulatorios
requieren la respuesta al compuesto estimular como constituido por elementos
independientes estimulares.

Compuesto serial: Para promover que los organismos traten los compuestos estimulares
como construidos por elementos independientes, los investigadores presentan los
elementos uno tras otro, en lugar de simultneamente.
Psicologa del Aprendizaje
CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA


La extincin implica la omisin del EI o reforzador.

- Extincin en el condicionamiento clsico: incluye presentaciones repetidas del
estmulo condicionado por s solo.
- Extincin en el condicionamiento instrumental: Implica no volver a presentar el
reforzador como una consecuencia de la respuesta instrumental.

El resultado es que la respuesta condicionada (ya sea clsica o instrumental) disminuye.
Por ello se piensa que la extincin es lo contrario a la adquisicin (como en el Modelo de
Rescorla y Wagner) sin embargo esto es incorrecto.

Diferencia entre extincin y olvido

Extincin: Se produce por la omisin del EI que sigue a las presentaciones del EC o la
omisin del reforzador que sigue a la respuesta instrumental.

Olvido: Disminucin de la respuesta condicionada que se da con el paso del tiempo.

1. EFECTO DE LOS PROCEDIMIENTOS DE EXTINCIN

- La respuesta disminuye cuando no vuelve a producir reforzamiento
- Adems la variabilidad de la respuesta aumenta (si la llave de mi casa un da no
abre la puerta intentar introducirle de distintas maneras a ver si lo consigo)

Estos efectos se muestran en un experimento con ratas en el que la extincin produjo una
disminucin en el nmero de secuencias de respuesta que los sujetos realizaban pero
aument la variabilidad de esas secuencias. Sin embargo es importante sealar que aparte
de la variabilidad de respuestas tambin segua dndose la respuesta inicial previa a la
extincin, por lo tanto podemos decir que la estructura bsica de la conducta instrumental
se altera muy poco por el hecho de introducir la extincin.

Por lo tanto: La extincin disminuye la tasa de respuesta e incrementa la variabilidad de
respuesta, pero no altera de otro modo la estructura de la conducta.

Adems de estos efectos podemos encontrar otros efectos emocionales como
consecuencia de la extincin:

Frustracin: Reaccin emocional inducida por la falta de un reforzador esperado. Puede
derivar en agresin.

2. EXTINCIN Y APRENDIZAJE ORIGINAL

Aqu vamos a ver varios ejemplos que explican porqu la extincin no elimina por completo
lo que se aprendi originalmente:

Recuperacin espontnea

Recuperacin espontnea tras el condicionamiento pavloviano: El efecto de la
extincin se pierde con el tiempo. Por lo tanto la respuesta condicionada volver a estar
Psicologa del Aprendizaje
CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

presente si el sujeto se pone a prueba tras una demora que siga al procedimiento de
extincin.

Recuperacin espontnea tras el condicionamiento instrumental: (la explicacin es
ms o menos la misma que en el ejemplo pavloviano anterior). En un experimento con
ratas se demostr que la respuesta cuya recuperacin se comprob tras un perodo de
descanso posterior a la extincin (R-Descanso) se dio a una tasa mucho ms alta que la
respuesta cuya recuperacin se midi sin un perodo de descanso posterior a la extincin
(R-No descanso).

Por lo tanto: La introduccin de un perodo de descanso tras la extincin produjo una
recuperacin sustancial en la respuesta.

Renovacin del condicionamiento excitatorio original

Renovacin: Se refiere a la recuperacin de la ejecucin propia de la adquisicin que se
da cuando se cambian las claves contextuales que estaban presentes durante la extincin.

En un experimento con ratas se comprob que un miedo condicionado y posteriormente
extinguido se renovava cuando se retiraba al grupo de ratas del nuevo contexto y se volva
a introducir en el contexto original de aprendizaje.

Por lo tanto: El hecho de que el miedo condicionado se renovara, indica que la prdida de
supresin durante la fase de extincin no refleja desaprendizaje de la respuesta de miedo
condicionado. Es decir, a pesar de la extincin y de que las ratas han dejado de dar la
respuesta, al cambiarlas de contexto la recuperan, por lo tanto nunca la desaprendieron.

La renovacin tambin puede darse si el sujeto se retira del contexto de adquisicin a un
contexto alternativo que no es el de la adquisicin original. Sin embargo en este caso la
renovacin no es tan slida como cuando se lleva al contexto original.

Otra explicacin de la renovacin: propiedades excitatorias condicionadas del contexto de
renovacin:

1) Contexto A: Adquisicin original
2) Contexto B. Extincin
3) Vuelta al contexto A que tiene propiedades excitatorias ya que es ah donde se produjo
la adquisicin.

Sin embargo algunos experimentos han demostrado que esto no es asentonces para
qu nos lo hacen estudiar????

Implicacin en la terapia de conducta: Aunque un procedimiento terapetico sea efectivo
extinguiendo una fobia en la seguridad de una sala de consulta del terapeuta, el miedo
condicionado puede volver a presentarse cuando el paciente se enfrente con un EC de
miedo en un contexto diferente.

Para reducir el efecto de renovacin, investigadores han llevado a cabo la extincin en
distintos contextos.


Psicologa del Aprendizaje
CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

Restauracin de la ejecucin propia de la extincin

Como ya hemos visto antes: La renovacin implica la reactivacin de la memoria del
condicionamiento original mediante la retirada del sujeto de las claves contextuales
presentes durante la extincin. Y ahora lo mismo dicho de otra manera: La renovacin
reactiva una conducta aprendida previamente mediante el cambio del contexto a
condiciones ms aproximadas a las presentes cuando la conducta se adquiri con
anterioridad.

Hasta aqu nada nuevo, se trata de lo mismo que hemos visto en el punto anterior. Sin
embargo

De la misma forma que recuperamos la respuesta original, tambin podemos recuperar la
respuesta de la extincin, (osea la no respuesta) Esto tiene mucho que ver con la
recuperacin espontnea ya que la conducta propia de la extincin puede restaurarse
(contrarrestando la recuperacin espontnea) presentando las claves que estaban
presentes durante la fase de extincin.

Nota para los que tengan mala memoria (como yo):

Recuperacin espontnea: Implica la recuperacin de la conducta condicionada
originalmente que sigue a la extincin si transcurre un perodo suficiente de tiempo tras la
fase de extincin.

Restablecimiento de la excitacin condicionada

Restablecimiento: Procedimiento que sirve para restaurar la respuesta a un estmulo
condicionado extinguido.

Ejemplo con patatas fritas: Si cojo aversin a las patatas fritas porque me puse enfermo en
un viaje tras comerlas, la aversin se extinguir comiendo patatas fritas en varias
ocasiones sin caer enfermo. Sin embargo, el fenmeno del restablecimiento sugiere que si
se cae enfermo otra vez por alguna razn, la aversin a las patatas fritas podra reaparecer
aunque la enfermedad no tuviera nada que ver con ellas.

Al igual que ocurra con el efecto de renovacin, es importante considerar si el efecto del
restablecimiento puede ser un resultado del condicionamiento contextual. El
condicionamiento contextual es un posible factor contribuyente debido a que las
presentaciones del EI que se dan durante la fase de restablecimiento pueden producir un
condicionamiento de las claves contextuales de la situacin experimental.

Diversos estudios han demostrado que el papel del contexto en estos casos es suprimir la
ambigedad de significado de un estmulo que tiene una historia mezclada de
condicionamiento y extincin. El contexto tiene un efecto pequeo en los estmulos que
tienen una historia slo de condicionamiento.

En realidad se considera el restablecimiento como una forma de renovacin: las claves
contextuales condicionadas proporcionan algunas de las claves contextuales para la
respuesta excitatoria en circunstancias normales. Estas claves contextuales se extinguen
cuando se presenta el EC por s solo durante la extincin.

Psicologa del Aprendizaje
CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

Sensibilidad a la devaluacin del reforzador

Por ms que he leido este apartado me cuesta mucho entenderlo por el libro. Asi que voy a
poner directamente la explicacin de un docente que he encontrado en el foro:
En una contingencia operante (instrumental), el procedimiento de devaluacin de un
reforzador consiste en asociar de forma pavloviana el estmulo que se est usando para
reforzar una conducta (comida, por ejemplo) con algn otro estmulo de naturaleza inversa,
es decir, aversivo (cloruro de litio, por ejemplo). El efecto resultante es una disminucin de
la respuesta operante que ha sido reforzada con el reforzador devaluado aunque sta
respuesta nunca haya sido contingente con el estmulo aversivo, ni siquiera con el
reforzador tras el proceso de devaluacin.
En una contingencia clsica (pavloviana, respondiente), el procedimiento es muy
similar y consiste en asociar el EI (con el que se estaba condicionando el EC) con otro EI
de naturaleza inversa. De nuevo, el efecto encontrado es una disminucin de la RC ante el
EC, aunque el EC nunca se haya relacionado directamente con el EI aversivo.
Lo relevante para el captulo que nos ocupa (Extincin de la conducta condicionada) es
que este efecto (el de la devaluacin del reforzador) se observa tambin en estmulos (en
el caso del condicionamiento clsico) y respuestas (en el caso del condicionamiento
operante) que han sido sometidas a procedimientos de extincin. Es decir, que despus de
extinguir un EC, por ejemplo, si devaluamos el EI con el que se condicion, la RC ante ese
EC ser todava menor que si simplemente lo hubisemos extinguido.
Este fenmeno se usa como evidencia para defender que los procesos de extincin no
eliminan las asociaciones realizadas durante el condicionamiento. Es decir, que las
asociaciones establecidas (EC-EI o R-Er) durante el aprendizaje no desaparecen durante
la extincin, aunque el sujeto no emita la RC o la R.
3- QU SE APRENDE EN LA EXTINCIN?

Asociaciones E-R inhibitorias

La falta de reforzamiento produce una asociacin E-R inhibitoria.

porqu ocurre esto?

En realidad la extincin implica un tipo especial de ausencia de reforzamiento, es decir, se
trata de ausencia de reforzamiento tras una historia de reforzamiento. La ausencia de
reforzamiento sin esta historia previa no es extincin, sino ms bien habituacin. La
ausencia de reforzamiento resulta aversiva slo despus de darse una historia de
reforzamiento. Por lo tanto los efectos emocionales de la ausencia de reforzamiento
dependen de forma crtica de la historia previa del sujeto. Si tu pareja nunca te ha hecho
caf por la maana, no te sentirs desilusionado cuando te despiertes y veas que no hay
caf.

Los efectos de la extincin son tanto conductuales como emocionales. Los efectos
emocionales se originan en la frustracin que se desencadena cuando un reforzador
esperado no llega. Se supone que la ausencia de reforzamiento cuando se espera
Psicologa del Aprendizaje
CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

recompensa desencadena una reaccin frustrante aversiva incondicionada. Esta emocin
aversiva sirve para que se deje de responder durante el curso de la extincin mediante el
establecimiento de una asociacin E-R inhibitoria.

Efectos paradjicos de la recompensa

Cuanto ms entrenamiento con reforzamiento se proporciona, ms fuerte ser la
expectativa de recompensa, y en consecuencia ms fuerte ser la frustracin que se da
cuando se introduce la extincin.

Efecto de sobreentrenamiento en la extincin: Si la disminucin en la respuesta se
debe a los efectos frustrantes de la ausencia de recompensa, un entrenamiento ms
extenso debera producir una extincin ms rpida. Es paradjico ya que el sentido comn
nos dira que un entrenamiento ms extenso debera crear una respuesta ms fuerte y ms
resistente a la extincin, pero sucede lo contrario.

Efecto de la magnitud del reforzamiento en la extincin: La respuesta disminuye ms
rpido durante la extincin que sigue a un reforzamiento con un reforzador mayor. La
ausencia de reforzamiento resulta ms frustrante si el individuo espera una gran
recompensa que si espera una pequea.

Efecto del reforzamiento parcial en la extincin (ERPE): (es el efecto ms estudiado).
Los efectos de la extincin sern diferentes dependiendo del programa de reforzamiento
usado. La extincin es ms lenta y produce menos reacciones de frustracin si haba un
programa de reforzamiento parcial (o intermitente) en lugar de uno continuo. Un buen
ejemplo de esto es el caso de los jugadores habituales ya que estn a merced del
reforzamiento intermitente. Las ganancias ocasionales les animan a seguir jugando a pesar
de largos perodos de prdidas.

Mecanismos del efecto de reforzamiento parcial en la extincin

Hiptesis de la discriminacin: La ausencia de reforzamiento es mucho ms fcil de
detectar tras el reforzamiento continuo. El reforzamiento parcial parece ensear a los
sujetos a no rendirse ante la ausencia del reforzador, y esta persistencia aprendida se
mantiene aun cuando los sujetos posteriormente experimenten una cadena ininterrumpida
de sucesos.

Qu aprenden los sujetos durante el reforzamiento parcial que les hace ms persistentes
al enfrentarse a una racha de mala suerte o de fracasos?: 2 teoras que vamos a ver a
continuacin:

Teora de la frustracin: Los sujetos aprenden sobre los efectos emocionales de la
ausencia de recompensa durante el entrenamiento en reforzamiento parcial.
Teora secuencial: Est basada en lo que los sujetos aprenden sobre la memoria de la
ausencia de recompensa.

Y ahora vamos a ver estas teoras con ms profundidad:

Teora de la frustracin (Abraham Amsel): La persistencia en la extincin es resultado del
aprendizaje de algo paradjico, es decir, continuar respondiendo cuando se espera no ser
reforzado o ser frustrado. La teora de la frustracin asume que el reforzamiento
Psicologa del Aprendizaje
CAPITULO 9: EXTINCIN DE LA CONDUCTA CONDICIONADA

intermitente da como resultado aprender a responder a pesar de esperar la ausencia de
reforzamiento. El reforzamiento intermitente da como resultado el aprendizaje de realizar la
respuesta instrumental como reaccin a la expectativa de ausencia de recompensa. Por el
contrario, no existe nada en la experiencia del reforzamiento continuo que motive a los
sujetos a responder cuando esperan ausencia de recompensa. El reforzamiento continuo
no produce persistencia en la extincin.

Teora secuencial: (Capaldi) Esta teora est formulada en trminos de conceptos de
memoria. Asume que los sujetos pueden recordar si fueron reforzador por realizar la
respuesta instrumental en el pasado reciente. El sujeto aprende a responder siempre y
cuando recuerde no haber sido reforzado en los ensayos precedentes.

D. RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL

Momento conductual: Este concepto se basa en el concepto de momento de la fsica
newtoniana. El momento de un objeto fsico es el producto de su peso (o masa) por su
velocidad. Esta hiptesis dice que la conducta que posee un momento elevado tambin
ser difcil de parar o interrumpir por las manipulaciones.

La investigacin sobre el momento conductual se ha llevado a cabo utilizando programas
mltiples de reforzamiento ya que capacitan a los investigadores para comparar la
susceptibilidad de la conducta a la interrupcin bajo dos condiciones diferentes en la
misma sesin.

Diversos experimentos concluyen que:

- El modelo conductual est relacionado directamente con la tasa de reforzamiento.
Una tasa ms alta de reforzamiento produce una conducta que tiene un mayor
momento y que es menos susceptible a la interrupcin.
- El momento conductual no est relacionado con la tasa de respuesta, es decir, do
conductas que se dan a tasas semejantes no es preciso que tengan grados
similares de momento conductual.
- Los programas que proporcionan tasas similares de reforzamiento pero tasas
diferentes de respuesta tienen similares momentos o resistencias al cambio.

La idea del momento conductual resulta intrigante porque intenta captar en un nico
concepto la resistencia de la conducta a diversas posibilidades de cambio. El concepto
fuerza de la respuesta est relacionado con esto.

También podría gustarte