Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(condicionamiento instrumental)
1. DEFINICIÓN:
Es el aprendizaje en el que una respuesta voluntaria se fortalece o debilita, segú n que sus
consecuencias sean positivas o negativas; es un aprendizaje segú n las consecuencias de su
acció n.
El término “operante” significa que: el organismo opera en su ambiente con el fin de producir
un resultado específico (deseable).
2. HISTORIA:
A fines del siglo pasado (1898), mientras Pavlov estaba ocupado con sus perros, Edward Lee
Thorndike, psicó logo y pedagogo americano, realizaba experimentos para determinar la
inteligencia animal, sobre todo determinar como aprendían los gatos. Diseñ ó una “caja-acertijo”
donde se introdujo un gato hambriento y se colocó comida fuera de la caja, donde el animal
podría verla y olerla. El gato aprende a pisar una palanca para escapar de la caja y coger la
comida. Los gatos aprendieron a emitir la respuesta necesaria má s rapidamente, a medida que
aumentaba el nú mero de ensayos.
Ley del efecto: “las respuestas satisfactorias tiene má s posibilidades de repetirse que aquellas
que no son satisfactorias”.
Skinner, es considerado como el padre de los psicó logos interesados al CDN OP. Los animales de
la Caja de Skinner obtenían el alimento operando en el ambiente interno de la caja. La caja
contenía una palanca: si el animal (palomas, ratones) descubría por casualidad que la presió n de
una barra (palanca) le permitía obtener alimento, tenía tendencia a repetir esta operació n, cuyas
repeticiones eran registradas sobre una curva por un estilete unida a una palanca.
C. ESTIMULO REFORZADOR.
Es un evento cualquiera, o consecuencia de estímulo que sigue a una respuesta y cuyo efecto
es incrementar la frecuencia de la respuesta o la conducta.
Ej. El alimento
Ed ------------------------ R -------------------------- Er
(Estímulo discriminativo) (Respuesta) (Estimulo reforzador)
Antecedente Consecuente
Respuesta A .......
Respuesta C ........
La conducta se halla bajo el efecto de dos estímulos: antecedente (ED) y consecuente (Er).
El Ed controla la conducta y el Er es consecuencia de la conducta.
El principio fundamental en el CDN OP. es el REFORZAMIENTO.
5. PRINCIPIOS BASICOS:
Son aquellos que describen la relació n entre la conducta y los acontecimientos ambientales que
influyen sobre ella.
Estos principios son: reforzamiento, extinción y castigo.
5.1. REFORZAMIENTO:
El principio de reforzamiento se refiere al aumento que se produce en la frecuencia
de una respuesta a la que sigue inmediatamente ciertas consecuencias.
La consecuencia puede ser la presentació n de un reforzador (+) / (-).
REFORZADOR:
Es cualquier estímulo que aumente la probabilidad de que se repita el comportamiento
precedente. Es todo estímulo (evento) que aumenta la probabilidad de la conducta a la
que sucede.
Un estímulo se define como reforzador por sus consecuencias. Es decir se define
exclusivamente mediante el efecto que tenga en una conducta, Rf (+) / Rf (-).
REFORZADOR PRIMARIO:
Es aquel estímulo en la cual no se aprende su valor reforzante (no dependen del
aprendizaje). Es una recompensa que satisface una necesidad bioló gica (ej. el
hambre o la sed) y que funciona de manera natural.
Ej. alimentos, bebida, sexo, vestimenta.
REFORZADOR SECUNDARIO:
Es aquel estímulo que se convierte en reforzador por su asociació n con un
reforzador primario (ej. el dinero, que nos permite conseguir alimento, que es un
reforzador primario). Son aprendidos a travez del proceso de socializació n.
Ej. reforzadores sociales: elogios verbales, la atención, el contacto físico,
expresiones faciales, son reforzadores condicionados. Si dependen del aprendizaje
PROGRAMAS DE REFORZAMIENTO:
Es el nombre que se da al programa con el que se elige la respuesta o respuestas que será n
reforzadas.
Reforzamiento continuo: Es el programa en el que se refuerza una respuesta cada
vez que ésta ocurra.
Reforzamiento intermitente: No se refuerza una respuesta cada vez que se presenta
sino solamente se refuerzan algunas ocurrencias de una respuesta.
PROGRAMA DE RAZÓN
En el cual el reforzamiento es contingente a la emisió n de un cierto número de
respuestas. Pueden ser de dos tipos:
PROGRAMA DE RAZÓN FIJA: Reforzamiento de la respuesta correcta luego de
un nú mero fijo de respuestas correctas.
RF:1 especifica que solo se necesita de una sola respuesta para que se dé el
reforzador. Ej. el pago del trabajo a destajo.
RF: 10, se reforzará cada 10 respuestas. $1 c/10 cajones de fruta recogidas.
PROGRAMA DE INTERVALO
En el cual se da el reforzamiento en base al lapso de tiempo que pasa antes de que
se pueda reforzarse una conducta. Son de dos tipos:
PROGRAMA DE INTERVALO FIJO: se refuerza a los sujetos por la primera
respuesta correcta emitida después de un cierto tiempo. Aprenden a esperar un
periodo determinado antes de responder y pueden realizar respuestas poco
antes de que haya transcurrido el tiempo establecido.
Ej. receta de cocina: “déjelo en el horno 45 minutos”, pero lo veremos antes.
Ej. “niños podréis ir a jugar cuando hayáis hecho las tareas ... ”. En muchos niños
se ve que el jugar con los amigos tiene una frecuencia mayor que el estudiar. Si la
conducta de mayor frecuencia (jugar con los amigos) se hace contingente sobre la
conducta de menor frecuencia (estudiar), se incrementará la conducta de menor
probabilidad.
5.3. ENCADENAMIENTO
Procedimiento que consiste en el reforzamiento combinado de conductas simples ya
establecidos en el repertorio del individuo para formar comportamientos má s complejos.
Enseñ a al individuo a ejecutar la secuencia como una conducta unitaria.
Procedimiento:
Definir el comportamiento meta o la conducta objetivo
Seleccionar las subhabilidades que la persona tiene
Reforzar cuando se dan las subhabilidades hasta formar la cadena completa.
5.4 EXTINCION
Es el procedimiento por el cual un comportamiento que ha sido previamente reforzado NO
ES MÁS REFORZADO, por consiguiente, disminuye su frecuencia hasta desaparecer y se
extingue.
La extinció n difiere del castigo en que ninguna consecuencia sigue a la respuesta.
Ej. Presionar la palanca y no se da alimento.
No comprar golosinas cuando el niñ o llora para conseguirlos.
Ventajas:
Reduce el comportamiento de forma efectiva.
Efectos a largo plazo.
No se requiere estímulos aversivos.
5.5 CASTIGO
Procedimiento que consiste en disminuir la probabilidad de una respuesta haciéndola
seguir de un estímulo punitivo (aversivo) o eliminando un reforzador positivo.
Estimulo aversivo: estimulo desagradable o doloroso.
Diferencias entre:
Reforzamiento negativo: Fortalece la conducta al eliminar algo desagradable del ambiente.
Castigo: añ ade algo desagradable al ambiente y, por lo tanto tiende a debilitar una conducta
CASTIGO:
Ventajas:
Cambiar la conducta rá pidamente.
Puede detener una conducta autodestructiva
Si es necesario emplear castigo para suprimir una conducta indeseable, se debe eliminar cuando
ocurra una conducta má s deseable. (para reforzar de manera negativa esa conducta). Así mismo
debe reforzarse con un RF (+), elogio, recompensa para fortalecer la conducta deseada.
Entrenamiento de evitación: aprendizaje de una conducta deseable a fin de evitar que ocurra una
condició n desagradable. Se ha estudiado en animales con dispositivos como una luz o un timbre par
evitar algú n castigo. No es ú til cuando aprendemos a llevar un paraguas cuando parece que va a
llover o no beber botellas etiquetadas con la palabra “veneno”.
No sabremos si algo reforzará o castigará hasta que veamos que se incrementa o disminuye la
ocurrencia de una respuesta. Un dulce puede ser reforzante pero si se come en exceso se puede
volver neutral o, incluso, un castigo.