Está en la página 1de 8

Programas de Reforzamiento

LA LEY EMPRICA DEL EFECTO Contingencia de respuesta-reforzador y Organizacin de la conducta

Una respuesta operante es una respuesta que controla la presentacin de una consecuencia (contingencia positiva) o que previene o termina el estmulo al que controla (contingencia negativa). El reforzamiento puede crear una nueva respuesta, modificar una respuesta existente o producir variabilidad conductual.

Por el tipo de contingencia entre la respuesta-consecuencia y el tipo de estmulo empleado, existen cuatro procedimientos de condicionamiento operante: a)reforzamiento positivo, la respuesta produce una consecuencia apetitiva, b)reforzamiento negativo, la respuesta evita una consecuencia aversiva, c) castigo positivo, la respuesta produce una consecuencia aversiva y d) castigo negativo, la respuesta evita una consecuencia apetitiva. Los programas de reforzamiento son las reglas que indican cundo y cmo se presentar la consecuencia despus de que se ejecuta la respuesta operante. Existen cuatro tipos de programas de reforzamiento: Razn Fija, Razn Variable, Intervalo Fijo Intervalo Variable. En los programas de razn, la entrega del reforzador depende del nmero de respuestas que hace el animal. En un programa de Razn Fija, el reforzador se entrega despus de que se emite un nmero fijo de respuestas(ejemplo, en un RF5 el reforzador se entrega despus de que el animal da 5 respuestas); en los programas de Razn Variable, el reforzador se entrega despus de que se emite un nmero variable de respuestas que se encuentran alrededor de un promedio (ejemplo, en un RV5 el reforzador se entregar en promedio cada 5 respuestas, esto es, en ocasiones despus de 4 respuestas, otras veces despus de 6, otras de 5, etc.). En los programas de intervalo, el reforzador est disponible hasta despus de que transcurre un intervalo de tiempo y se entrega en el momento en que se ejecuta la respuesta operante una vez transcurrido el intervalo. En un programa de Intervalo Fijo el reforzador est disponible despus de un intervalo fijo de tiempo y se entrega slo si el animal da una respuesta despus de transcurrido el intervalo(ejemplo, en un IF3min, el reforzador slo est disponible despus de que transcurren 3 min, por lo que la primer respuesta que da el animal despus de que pasan los 3 min, ser reforzada). En un programa de Intervalo Variable, el reforzador est disponible despus de un tiempo promedio (ejemplo, en un IV3min el reforzador estar disponible en promedio cada 3 minutos, puede ser a los 2, 3 y 4 minutos).

Es importante no confundir los programas de Intervalo con los de Tiempo. En los programas de Tiempo (fijo o variable), el reforzador se entrega despus de que transcurra el intervalo establecido y no es necesario que el animal emita una respuesta. Mientras que en los programas de Intervalo se necesitan 2 condiciones para recibir el reforzador: a) que transcurra el tiempo establecido y b) que el animal ejecute la respuesta (no importa si es justo al terminar el intervalo o mucho tiempo despus). Si se hace una grfica de registro acumulativo de las respuestas ante los 4 programas de reforzamiento, se obtienen distintos patrones (ver Figura 1). En los programas de RF los animales responden de manera rpida y constante hasta alcanzar el criterio de reforzamiento, sin embargo, una vez que obtienen el reforzador hacen una pausa post-reforzamiento. En los programas de RV los animales responden ms rpido que en los de RF y lo hacen de manera constante sin hacer pausas predecibles.

Fig. 1. Se muestran los patrones de respuestas que se generan bajo los 4 diferentes programas de reforzamiento: RF, RV, IF e IV

Bajo los programas de IF los animales no responden mientras transcurre el intervalo y slo cuando el intervalo va a llegar a su final comienzan a responder de manera muy rpida y constante, generando una curva que se conoce como festn. Bajo programas de IV, los sujetos responden de manera muy lenta pero constante (sin pausas predecibles y es el programa en el que se responde ms lento). Durante la extincin, la respuesta operante ya no es seguida de la consecuencia. El patrn conductual en la extincin es un incremento en la respuesta operante llamado rfaga de respuestas seguido de la disminucin en la tasa de la respuesta. Cuando se extingue una conducta y se vuelve a colocar al sujeto ante la misma situacin, se vuelve a presentar la respuesta operante; a este fenmeno se le conoce como recuperacin espontnea.

Objetivo: El alumno entrenar al comedero a una rata virtual, le moldear la respuesta de palanqueo, la reforzar bajo un programa de reforzamiento, le extinguir la conducta y observar el efecto de recuperacin espontnea.

Lugar: Laboratorio de Cmputo. Material: Programa Sniffy The Virtual Rat Computadora Memoria USB Duracin: 4 horas.

Desarrollo: A) Cada alumno trabajar en una computadora. B) La prctica consistir en 5 pasos que cada alumno debe realizar con Sniffy: 1. Entrenamiento a comedero, 2. Moldeamiento a la palanca, 3. Programa de reforzamiento, 4. Extincin y 5. Recuperacin espontnea. C) Entrar al programa Sniffy The Virtual Rat. Te encontrars con las siguientes ventanas en la pantalla:

D) Realiza los siguientes pasos: 1. ENTRENAMIENTO AL COMEDERO a) Graba tu archivo como comedero. Para guardarlo, en la barra de Men entra a: File Save As comedero aprieta OK b) Cada vez que la rata se aproxime al comedero entrgale un pellet de comida (aprieta la barra espaciadora o da un click con el mouse sobre la palanca de la caja operante). c) Sniffy estar condicionada clsicamente al comedero cuando la barra sound-food de la grfica de Asociacin Operante llegue al mximo. d) Guarda el archivo (NO OLVIDAR ESTE PASO)

2. MOLDEAMIENTO A LA PALANCA a) Abre el archivo comedero b) Guarda el archivo como palanca c) Moldea a la rata por aproximaciones sucesivas para que apriete la palanca. Sniffy estar condicionada operantemente a la palanca cuando la barra barsound de la grfica de Asociacin Operante llegue al mximo. d) Guarda el archivo.

3. PROGRAMA DE REFORZAMIENTO a) Abre el archivo palanca b) Se le asignar a cada persona un programa de reforzamiento. Para entrenar a Sniffy debern ir incrementando la razn (si es un programa de RF o RV) o el tiempo (IF o IV) poco a poco. Por ejemplo, si deben entrenar a Sniffy en un programa RF25, hganlo con los pasos intermedios: RF2, RF5, RF10, RF15, RF20 para terminar con RF25, de otra manera se extinguir la conducta de palanqueo (si intentan dar saltos muy grandes pues para la rata ser como si no hubiera reforzador por apretar la palanca). c) Guarda el archivo para cada paso de tu entrenamiento con el nombre que corresponda al programa que vas a emplear (ejemplo, RF2). d) En la barra de Men entra a las opciones: Experiment Design Operant Experiment. Saldr una ventana, marca la opcin Fixed si vas a emplear un programa fijo y Variable si vas a emplear un programa variable. Escribe en la ventana el valor de la razn o el tiempo en segundos. Marca la opcin Seconds si vas a emplear un programa de intervalo y Responses si vas a emplear un programa de razn. Aprieta el botn OK.

e) Sniffy estar condicionada al programa de reforzamiento cuando la barra bar-sound de la grfica de Asociacin Operante llegue al mximo y se mantenga ah.

f) Guarda el archivo. g) Entrena el siguiente paso (ejemplo RF5 y repite los puntos del a alg hasta que alcances el valor que se te pidi entrenar, por ejemplo RF25).

NOTA: Al introducir los datos para programar el experimento, la caja operante entregar a Sniffy los reforzadores en el momento adecuado (nmero y tiempo), t ya no tienes que entregar los reforzadores , la computadora lo hace (si llegas a entregar un reforzador ser como regalarle uno a Sniffy y dificultars su entrenamiento). Tu papel en el punto 3 slo ser el de observar cmo aprende Sniffy e ir introduciendo los datos para cada uno de los pasos que se entrenarn (ej, RV2, RV5, RV10, RV15, RV20, RV25). No te asustes si al empezar a entrenar el programa de reforzamiento baja el nivel de la barra bar-sound, esto es normal pues inicia un nuevo aprendizaje por lo que se pierde por un tiempo la asociacin entre la palanca y el reforzador, la barra deber volver a su nivel mximo cuando la rata aprenda la nueva contingencia (ejemplo RF2).

Truco: Al iniciar el entrenamiento de los diferentes programas de reforzamiento, te dars cuenta que en ocasiones Sniffy tarda mucho en aprender (la barra bar-sound sube a su mximo pero no se mantiene ah sino que sube y baja constantemente). Lo que puedes hacer para apresurar el aprendizaje es cerrarle a Sniffy la puerta de la caja operante, as no se distraer y aprender ms rpido. Para hacer esto debes ir al Men y elegir Experiment Isolate Sniffy. Vers cmo se cierra la puerta y cmo el registro acumulativo avanza rpidamente. Cuando la Sniffy aprenda a responder en el programa que le pediste puedes volver a verla seleccionando en el Men: Experiment Show Sniffy. Puedes repetir esto para cada paso del entrenamiento (tambin para la extincin).

4. EXTINCIN a) Abre el ltimo archivo que empleaste (por ejemplo, RF25) b) Guarda el archivo como extincin c) En la barra de Men entra a las opciones: Experiment Design Operant Experiment: - marca la opcin Extinction - marca la opcin Mute Dispenser - Aprieta el botn OK d) La conducta de Sniffy se extinguir cuando la barra bar-sound de la grfica de Asociacin Operante llegue al mnimo. e) Guarda el archivo.

5. RECUPERACIN ESPONTNEA a) Abre el archivo extincin b) Guarda el archivo como recuperacin espontnea c) En la barra de Men entra a las opciones: Experiment Remove Sniffy for Time-Out aprieta OK. Esta opcin simular que retiraste a Sniffy de la caja operante y que despus de un tiempo, la volviste a colocar en la caja. d) Observa la recuperacin espontnea de la conducta. e) Guarda el archivo. E) REPORTE ESCRITO Hacer un anlisis de lo observado en cada uno de los pasos (1-5) en los que se entren Sniffy. Para los pasos del 2 al 5 se deber copiar la grfica de registro acumulativo y pegarla en un Documento de Word. Se incluir en el reporte de la prctica un anlisis del patrn de conducta que se observa en cada una de las grficas (del paso 2 al 5). Para copiar la grfica seleccionen la ventana del registro acumulativo (hacer click en cualquier parte de la grfica de manera que la barra superior se vea de azul ms brillante que el de las dems ventanas). Ir al Men y en Edicin seleccionar copiar ventana actual. Posteriormente abrir un documento nuevo en Word y pegar la imagen. Las conclusiones debern incluir una breve discusin sobre lo aprendido en la prctica as como las dificultades encontradas para entrenar a Sniffy en relacin a la teora revisada en clase.