Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONDICIONAMIENTO CLÁSICO
Para alimentarse, eludir los depredadores o para reproducirse, los animales disponen de mecanismos
fisiológicos y motores que contribuyen a realizar estas funciones biológicas; sin embargo, no basta con
ellos para sobrevivir; es preciso además aprender a localizar los alimentos, dónde se esconden los
depredadores o cómo atraer a la pareja. Estas funciones se consiguen gracias a los mecanismos del
condicionamiento y el aprendizaje asociativo.
Dickinson, 1980
El aprendizaje asociativo es un aprendizaje que tiene lugar cuando dos elementos se conectan en
nuestro cerebro, y cuyos procesos tienen lugar mediante la experiencia y produce cambios en la
conducta.
1
un fenómeno mucho más interesante que analizar y cambió el rumbo de su investigación. De hecho,
dedicó el resto de su trayectoria investigadora al estado de lo que se conoce como aprendizaje por
condicionamiento. El condicionamiento clásico es el método por el cual al presentar un estímulo
previamente neutro en contigüidad espaciotemporalmente con otro estímulo capaz de suscitar una
respuesta a de manera innata, el primer estímulo queda asociado con el segundo de tal forma que
acaba siendo capaz de suscitar por si solo dicha respuesta.
o EC estímulo condicionado (estímulo que por asociación con un EI es capaz de provocar una
respuesta que antes del entrenamiento no provocaba). Es aquel estímulo que antes del
condicionamiento es considerado con un estímulo incondicionado (EI) provoca una respuesta
refleja condicionada en el sujeto (p.e. un tono o una luz).
2
o RI respuesta incondicionada (respuesta que se emite de forma automática ante la presencia
de un determinado EI). Respuesta que provoca estímulo incondicionado.
EI → RI EC → Estímulo condicionado
EC-EI → RI EI → Estímulo incondicionado
RC → Respuesta condicionada
EC → RC RI → Respuesta incondicionada
b) Automoldeamiento
En el otro ejemplo, observamos el fenómeno de automoldeamiento. Hay dos estímulos. Aparece el
de la izquierda en rojo y recibe comida (esto es condicionamiento) El estímulo provoca la
respuesta. El otro estímulo (gris) no da comida. ¿Cuál es la respuesta refleja que provoca en un
animal hambriento? Conducta de aproximación. Después de hacer varias veces esto, observamos
que a la luz roja se acerca y coge la comida pero también se da la respuesta condicionada que es
picotear la luz roja (RC) Este es el otro ejemplo de paradigma apetitivo que se llama
automoldeamiento. El efecto principal de la experiencia es que un estímulo neutro que antes no
daba respuesta, ahora provoca un aumento de respuesta.
Justo antes de la presentación del EI (comida) se encendía un disco luminoso (EC). Así, el EC
adquiría la propiedad de informar sobre la disponibilidad de la comida (la comida era proporcionada
independientemente de las respuestas de la paloma) Se observó un fenómeno curioso: en vez de
acercarse directamente al plato cuando veían la luz, las palomas comenzaron a picotear primero el
disco cuando este se encendía (incluso bajo el riesgo de no llegar a tiempo a por la comida) Esta es
una prueba de la atracción que ejercen las señales condicionadas clásicamente cuando el premio es
3
la comida. Los acontecimientos que predicen un suceso relevante estimulan una conducta de
seguimiento debido a su significación informativa. Esto también ocurre en humanos (por ejemplo,
cuando estamos en un ascensor y vamos siguiendo los botones que se iluminan indicando el piso por
el que pasamos a pesar de que el hecho de que miremos fijamente no hará que lleguemos antes a
donde queremos.
En los humanos también ocurre (reflejo palpebral) En un experimento, hacemos que el sujeto observe
una pantalla de ordenador con casos, teniendo estímulos auditivos o viendo proyecciones (imágenes)
Por ejemplo presentamos por el altavoz nombres de ciudades que sean capital de provincia y cuando
aparecen capitales de provincias aplicamos descargas en el ojo o una corriente de aire, lo que provoca
parpadeo. Al repetir la experiencia varias veces y repetirle varias veces las palabras, aunque no haya
corriente de aire el sujeto parpadea por efecto del condicionamiento (RC)
4
d) Condicionamiento del miedo
¿Qué son los estímulos fóbicos? ¿Los que provocan miedo o ansiedad? ¿Han adquirido un significado de
que es biológico? Es una conducta o respuesta con distintos componentes que es para escapar de los
estímulos fóbicos y así sobrevivir. El miedo, para reducirlo, se mide mirando cómo afecta a actividades
cotidianas que realizábamos normalmente. Los procedimientos apetitivos provocan aumento de la
respuesta. Los aversivos no necesariamente provocan reducción de la respuesta (más bien aumento) en
el ejemplo del conejo, el parpadeo no se elimina, sino que se incrementa. Tanto en condicionamiento
aversivo como apetitivo puede haber disminución o aumento de la respuesta dependiendo de la
situación. En el miedo hablamos de la supresión condicionada, que estima como afecta al miedo a la
realización de tareas cotidianas. Si medimos el condicionamiento del miedo con ratas y electrificamos
el suelo de la jaula, el EI será la descarga que esto provoca en los pies. La RI es la respuesta de miedo,
huida o evitación y el EC es la luz o tono que le indica la sucesiva descarga. Lo que nos interesa aquí es
¿Cómo medimos el grado en que hemos conseguido condicionar la respuesta de miedo ante el EC (luz,
tono)? Utilizamos un método indirecto llamado supresión condicionada. La supresión condicionada es un
índice que nos informa sobre el grado en que un estímulo condicionado al miedo altera la actividad que
está llevando a cabo el animal. Para medirlo, se comparan el nº de veces que se presenta la respuesta
en presencia del EC (asociación aversiva) con las veces que se presenta la respuesta instrumental
cuando no está el EC (ambos períodos de tiempo deben ser iguales).
5
embargo, esto responde a la importancia biológica que tiene para los animales saber que sustancias les
resultan dañinas, por eso es un aprendizaje tan eficaz.
Los procesos de salivación y automoldeamiento son de carácter apetitivo (el EI es un hecho o situación
deseada), mientras que el condicionamiento palpebral, supresión condicionada y aversión gustativa son
aversivos (el EI es un hecho o situación no deseada).
VARIEDADES DE CONDICIONAMIENTO
CLÁSICO
(ESQUEMA)
6
Valor motivacional del EI:
- Si es apetitivo, hablamos de condicionamiento clásico apetitivo
- Si es aversivo, hablamos de condicionamiento clásico aversivo
Relación EC-EI
El condicionamiento clásico permite aprender o detectar relaciones causales entre estímulos del
ambiente. ¿Cuántos tipos de relación puede haber? Uno que dé lugar a otro (relación causal positiva o
contingencia positiva) E1-> E2 para referirse a situaciones en las que tras un estímulo aparece
necesariamente el otro (un acontecimiento predice el otro)
Por ejemplo, cuando se da una relación causal positiva decimos que el condicionamiento resultante es
excitatorio porque provoca necesidad de respuesta en el organismo (que será distinta según el valor
del EI). Uno que aparece en primer lugar se percibe como causante del otro. Excitatorio que será
aversivo o apetitivo según la naturaleza (según el valor motivacional del EI).
Con independencia de que sean placenteros o aversivos y con independencia de la relación causal de los
estímulos, el otro criterio sería condicionamiento inhibitorio/excitatorio en base a la relación causal o
contingencia que entiende el sujeto (ambos provocan aumento o disminución de la respuesta):
Contingencia positiva: aumento (el sujeto percibe que hay un nexo causal entre dos estímulos).
Aparece el EC y luego necesariamente aparece el EI (condicionamiento clásico excitatorio =
contingencia positiva). Existirá, por tanto, una relación de contingencia entre EC y EI generando
una RC. Situaciones donde un estímulo causa necesariamente la aparición de otro (luz -> comida /
tono -> descarga). Hablamos de aprendizaje excitatorio porque provoca una respuesta nueva en el
organismo.
7
Hay 2 tipos de condicionamiento clásico inhibitorio:
o Condicionamiento clásico inhibitorio apetitivo : se da cuando existe una situación agradable que
no se llega a producir.
o Condicionamiento clásico inhibitorio aversivo: se da cuando la situación desagradable que se
tendría que producir no se lleva a cabo.
PROCESOS GENERALES
CURVA DE ADQUISICIÓN
Por ejemplo, en el primer ensayo de la curva arriba representada se alcanza casi el 50% del
aprendizaje, en el segundo hay un aumento, pero menor que el anterior y así sucesivamente (nunca
superará el valor máximo de la asíntota). La línea crece de forma negativamente acelerada (siempre
crece, pero cada vez un poco menos). En cualquier proceso de condicionamiento se sigue esta línea.
EXTINCIÓN
Si después de la asíntota (el máximo crítico) presentamos el EC solo, sin el EI tiende a desaparecer
(extinción). La RC ante el EI va disminuyendo hasta que desaparece (extinción de la respuesta
condicionada, algo que es distinto al olvido por el paso del tiempo porque hay un aprendizaje inhibitorio
por una contingencia negativa).
Si tras un periodo de tiempo se deja de presentar el EC y una vez extinguía la respuesta se vuelve a
presentar el EC aparece RC (recuperación espontánea) pero con menor fuera que en el momento
asintótico. Con lo cual no es un olvido permanente del aprendizaje y no es una vuelta al estado original.
Presentaciones repetidas del EC hacen disminuir la magnitud de la respuesta (recuperación
espontánea). La recuperación no es el máximo, es más pobre.
8
GENERALIZACIÓN
DISCRIMINACIÓN
Por ejemplo, en una persona un lunar. Si presentamos en un plato cordero y en el otro plato acelgas, es
fácil de discriminar. Si presentamos el cordero con un plato de canguro, ya no lo será tanto. Sin
embargo, con el paso del tiempo encontramos diferencias entre ellos. (Ejemplos: diferenciar a dos
gemelos, distinguir do-re)
9
ANÁLISIS PARAMÉTRICO
o Huella Una vez terminado el EC, transcurre un tiempo antes de la introducción del EI, es
decir, el EI se presenta cuando ya ha terminado el EC (la memoria copia del estímulo que deja
una huella en la memoria con el paso del tiempo) A veces enseña más a inhibir la respuesta o a
retenerla que a ejecutarla.
o Hacia atrás Hay otro que es hacia atrás (se presenta el EI y luego el EC poco después,
tiene resultados ambiguos)
10
Intervalo óptico
Intensidad del EC
Intensidad del EI
11
CONDICIONAMIENTO INSTRUMENTAL
PARADIGMA INSTRUMENTAL
Condicionamiento instrumental: aprender a
realizar una conducta o actividad nueva
(conducta o respuesta instrumental) ante un
estímulo discriminativo, el cual utiliza el sujeto
para obtener algo. La recompensa es un
reforzador.
El condicionamiento instrumental y el
condicionamiento clásico son dos variedades de
un proceso común de asociación. En el
condicionamiento clásico el sujeto es pasivo, la
aparición de los dos estímulos (EI y EC) no
dependen de lo que el sujeto haga, no es necesario que el sujeto realice la respuesta tras el EC para
que aparezca el EI. Este aparece independientemente de lo que el sujeto haga, es el experimentador
el que decide. La respuesta que realiza el individuo es consecuencia del condicionamiento.
Thorndike quiso estudiar la inteligencia animal. Para ello metía un gato hambriento en una caja
problema y ponía comida fuera. La tarea del gato consistía en aprender a escapar de la caja para
obtener la comida. Comprobó que a medida que avanzaban los ensayos, los gatos tardaban menos en
salir. Interpretó que esa mejora era resultado del aprendizaje, de una asociación entre su conducta y
el estímulo antecedente. Formulo entonces la ley del efecto que dice que si una respuesta ejecutada
en presencia de un estímulo, va seguida de un hecho satisfactorio, la asociación entre el hecho y la
respuesta se fortalece. Si el hecho es molesto, la asociación se debilita.
Estos resultados despertaron el interés de los científicos, que diseñaron nuevas situaciones
experimentales.
o Ensayos libres (Small 1900, laberintos) Solo pueden realizar la respuesta instrumental una vez por
ensayo. Corredor (laberinto recto) y laberinto en forma de T.
o Operante libre (El sujeto puede repetir la instrumental una y otra vez) B. F Skinner (1938) quería
analizar en laboratorio una forma de conducta que fuera representativa de toda la actividad que se
12
produce continuamente. En la caja se Skinner medimos la latencia de respuesta, magnitud… pero sobre
todo la tasa de respuesta. Previamente hay que definir una unidad mediable de conducta. Definimos
unidades de conducta en función de su funcionalidad.
ED R REF
Negativos: Señal del ambiente que indica que hay una relación de contingencia negativa
entre su acción y las consecuencias (no hay reforzador presente) Indica que de la acción no
se deriva una consecuencia (no tiene que ver con el valor motivacional).
13
o Respuesta instrumental (RIns): es
una respuesta intencionada en el
sentido de que tiene un fin, puesta
que se realiza con el fin de obtener un
reforzador.
o Reforzador: consecuencia
encaminada a fortalecer la relación
Ed-Respuesta instrumental.
El sujeto realiza una acción (conducta
o respuesta instrumental) en
presencia de unos estímulos determinados (estímulos discriminativos, Ed) que da lugar a la
obtención/eliminación de ciertas recompensas (reforzadores) tras realizar la respuesta
instrumental. Siempre se debe debe realizar la respuesta para poder obtenerlo.
En el condicionamiento clásico recordamos que un E neutro tras su asociación con el EI, pasaba a
ser EC. La respuesta instrumental es el acto motor, intencional, propositivo y encaminado a una
respuesta instrumental, la cual conllevará un reforzador. Por ello, Tolman decía que un acto
instrumental refleja conocimiento.
La respuesta se realiza en un contexto específico (yo no tecleo mi número de cuenta en el
ordenador para sacar dinero, lo hago en el cajero; tampoco pido el café en una lavandería).
¿Un Ec es lo mismo que un Ed? No son lo mismo. Los Ed son estímulos presentes en el
condicionamiento instrumental que indican al individuo la relación entre la acción y sus consecuencias.
Cuando el EC se presenta, va seguido por el EI y se presentan con independencia de lo que el sujeto
haga. En cambio el Ed no indica que va a recibir el EI, es una señal que indica que puede realizar la
conducta tras la cual va a recibir el reforzador. El reforzador es lo mismo que el EI, solo que
utilizamos terminología diferente para cada paradigma. Un EC entonces es una señal que advierte al
sujeto que de modo inmediato se va a producir el EI (el sujeto no tiene que hacer nada) El Ed es una
14
señal que indica al sujeto que en esas condiciones se debe realizar una acción para obtener
determinados estímulos (reforzadores) En términos físicos pueden ser idénticos pero su significado
es distinto para el sujeto.
Hay contingencia relativa si hay un resultado positivo o negativo. Sólo se necesita que una conducta
provoque esas consecuencias.
15
(Completar)
o RECOMPENSA
Por ejemplo, salario y trabajo realizado, estudiar y aprobar.
“Entrenamiento o aprendizaje de recuperación”. Aumento de la respuesta.
Contingencia positiva y un reforzador apetitivo (reforzador positivo por lo que aumenta la
respuesta).
o CASTIGO POSITIVO
Un sujeto presiona la palanca y recibe una descarga eléctrica. Si no realiza la acción, no la
recibe.
Contingencia positiva, porque hay relación y reforzador aversivo ¿Qué efecto conductual tendrá?
Disminución de la respuesta (“castigo positivo”, el nombre no tiene que ver con el valor
motivacional)
¿Semejanzas o diferencias entre ambos? En ambos casos hay contingencia (relación) positiva entre
una acción y una consecuencia. Lo que las diferencia es el valor motivacional del reforzador (en la
recompensa una conducta lleva a conseguir algo positivo, en el castigo positivo una conducta te lleva a
conseguir algo que no tiene para ti valor motivacional alto)
“Entrenamiento de omisión”: Impide algo positivo. Los efectos conductuales son parecidos a los del
castigo negativo.
Tengo 8 puntos en el carnet, si me salto el semáforo me retiran puntos.
Abro la ventana, llega el ladrón y me quita el cuadro.
Mi conducta instrumental es inapropiada y conlleva que me quiten puntos, algo que yo tenía.
16
o EVITACIÓN O ESCAPE
La conducta o respuesta interrumpe o impide algo aversivo, impide algo negativo, pone fin a algo
desagradable (evitación). El reforzador retirado es de tipo aversivo por lo que aumenta la
respuesta. Contingencia negativa. Usa sus actos para eludir hechos aversivos ¿Qué puedo hacer
para eludirlo? La respuesta interrumpe exponerse a la estimulación aversiva. Escape es para eludir
un hecho que ya has experimentado en parte, y evitación es para eludir un hecho que aún no has
experimentado.
- Escapa es cuando el sujeto ya está expuesto al estímulo aversivo y la conducta pone fin al
estímulo.
- Evitación es cuando la conducta se da antes de que se presente el estímulo aversivo.
No quiero ir a la cena de nochebuena porque no aguanto a la familia, por tanto digo que tengo
que ir a una cena de trabajo a la que no puedo faltar para evitar ir a la cena de familia (evitar).
El rey se marchó porque Chávez no se callaba (escape). Es positiva (la consecuencia) porque
eludes consecuencias o situaciones negativas.
Marchar de clase por no aguantar al profesor.
El perro escapa de A ante la descarga, cuando aprende a anticipar la descarga entonces es
evitación.
17
o Castigo positivo (CI) y excitatorio aversivo (CC)
Ambos son experiencias negativas, pero en el condicionamiento clásico como su propio nombre
indica, aumenta la tasa de respuesta y en el condicionamiento instrumental disminuye.
- Semejanzas: contingencia positiva (EI y reforzador negativo)
- Diferencias: en el excitatorio aversivo aumenta la respuesta y en el castigo es más baja
(disminuye) por lo que hay distintos efectos conductuales
o Generalización
Cuanto más similares son los estímulos más se
parece la respuesta.
o Discriminación
Ocurre lo contrario. Saber exactamente ante que
estímulo responder para que hay recompensa.
Consiste en responder de manera diferenciada
hacia estímulos similares. Hay dos mecanismos.
¿Cómo aprendemos a discriminar por ejemplo
entre una luz de 600 mm y una de 650? Al
principio, el individuo responde por igual, pero tras unos
entrenamientos aprende a distinguir, a ver que tras uno
hay reforzamiento y tras otro no.
18
o Magnitud de la recompensa
Se introducen dos sujetos en un laberinto lineal en cuya meta se encuentra una caja con comida. El
tiempo de realización de la conducta disminuye a medida que aumentan los ensayos. Mientras el primer
sujeto recibe 6 bolitas de comida, el segundo tan solo recibe 1. El que aprende más rápido es el que
recibe 6 bolitas, debido a la mayor magnitud de su recompensa. Cuando ambos sujetos han alcanzado la
asíntota del aprendizaje, se comienza a dar 6 bolitas también al segundo sujeto, de manera que este
reduce aún más el tiempo de realización de la conducta (hay mayor valor del reforzador). Se trata de
un ejemplo de aprendizaje incentivo.
EJ: cuando al sujeto acostumbrado a 1 bolita, cuya velocidad de respuesta era más lenta, les
suministramos 6, y la tasa de respuesta
aumenta mucho más que las que recibían 6,
que por el contrario, mantienen su velocidad
de respuesta.
19
sujetos responden menos intensamente a un premio desfavorable si han recibido un premio
mejor si no han tenido esta experiencia anterior. El premio desfavorable parece especialmente
malo a los sujetos al contrastarlo con el que habían recibido antes, que era mejor.
EJ: aquellas ratas que reciben una bolita tienen una tasa de respuesta constante, y las que
reciben 6 una menos constante. Tras un periodo de tiempo, a ambos grupos se les da una bolita
de comida, de tal manera que el primer grupo, sigue experimentando una velocidad de
respuesta similar. En cambio, en el segundo grupo, ya que la recompensa disminuye, las ratas
sufren una recaída de mayor magnitud que aquellas a las que se mantuvo.
FORMAS DE REFORZAMIENTO
Lo más importante de todo lo dicho es el modo en cómo se administre.
20
realizada y reforzada. La obtención del reforzamiento depende de la última vez que la conducta
fue reforzada.
IF (depende de un intervalo fijado, por ejemplo 30 segundos) Depende del tiempo transcurrido
desde la última vez que el sujeto recibió la recompensa
IV (intervalo variable) El tiempo varía (a veces una semana, otras un mes…)
o Razón: la obtención de la recompensa depende del número de acciones que realiza el sujeto) Para
obtener la recompensa hay que realizar la conducta un número determinado de veces que puede
ser fijo (RF) o variable (RV)
Cada programa tiene su pauta típica de respuesta. En general, el reforzamiento intermitente (efecto
del reforzamiento parcial) genera tasas de respuesta más alta. Por ejemplo, máquinas tragaperras.
21