Está en la página 1de 11

CONDICIONAMIENTO OPERANTE EN LA RATA VIRTUAL SNIFFY

Sánchez A; Varela T; Ordoñez M; Martínez J; Goyeneche K; Barbosa D.

Facultad de Psicología, Fundación Universitaria Konrad Lorenz

En el presente trabajo se dará a conocer el condicionamiento operante explicándolo desde


un planteamiento, tiene como objetivo identificar la conducta de una rata en el condicionamiento
operante, para ello se utilizó un programa llamado Sniffy Pro, este programa tiene como fin simular
una situación del condicionamiento operante la cual se le denomina respuesta condicionada
emocional El condicionamiento operante constituye uno de los mecanismos de aprendizaje de
mayor importancia teórica y práctica, ya que es el más investigado y mejor comprendido, por otra
parte, es fuente de algunas de las más significativas aplicaciones de la psicología a problemas
concretos. Este es un proceso mediante el cual se aumenta o disminuye la probabilidad de dar una
respuesta, designando Skinner a esto como Reforzamientos, el cual consiste en un estímulo
reforzante, que incrementa la posibilidad de un comportamiento, pudiendo ser este negativo o
positivo, dependiendo de la relación que se tenga con el medio ambiente. En este trabajo, veremos
su estructura sobre un software (Sniffy), analizando los distintos tipos de refuerzos y factores que
influyen en este, también reforzamientos que pueden ser parciales o continuos. Las Fases en la
modulación del comportamiento operante se da por: Adquisición, la respuesta que refiere a la fase
del aprendizaje en que la respuesta es seguida por reforzadores. Durante la adquisición la respuesta
se vuelve más fuerte o más frecuente, debido a su relación con la consecuencia reforzante;
Generalización, las respuestas fortalecidas mediante procedimientos operantes en un conjunto de
circunstancias tienden a extenderse o a generalizarse en situaciones similares, entre más parecidos,
más probable es la generalización; Discriminación, el sujeto desarrolla discriminaciones al
reforzarse las respuestas en una situación; Extinción, cuando se retira el reforzamiento para alguna
respuesta particular, dicha conducta disminuye su frecuencia hasta que sólo ocurre con la misma
frecuencia con que ocurría antes del reforzamiento; y por último se encuentra la Recuperación
espontánea, las respuestas que se han extinguido vuelven a aparecer algunas veces, es decir, se da
una recuperación espontánea después de un descanso. Ha sido investigado por Skinner, que tiene
un claro antecedente en el aprendizaje basado en el ensayo y el error estudiado por Thorndike.
Edgard L. Thorndike trabajo con gatos y cajas llamadas cajas problema, en donde metía a los gatos
a dichas cajas, y fuera de esta colocaba un plato de comida, esperando que el gato encontrara una
manera de salir. El gato emitía respuestas inciertas hasta conseguir salir de la caja, entonces
Thorndike encuentra que la latencia o tiempo de salir de parte de los gatos de las cajas disminuía a
medida que se repetían los ensayos. Esta situación es lo que constituye el aprendizaje por ensayo
y error. (Mestre, J.M., Palmero, F, 2004) Thorndike formula en 1911 la Ley del efecto: Si una
respuesta en una situación estimulada dada es seguida por un suceso satisfactorio o placentero, la
relación entre la situación y la respuesta se fortalece, de forma que el organismo tendrá más
tendencia a dar esa respuesta en esa situación. Si por el contrario va seguida de un suceso nocivo
o desagradable, la respuesta tenderá a no darse. La medida de la respuesta en el condicionamiento
operante se realiza por la tasa de respuestas en un período de tiempo dado, es decir, número de
veces que se presiona la palanca durante un período; también es tasa de respuesta la medida de la
velocidad con que un sujeto ejecuta una operación. La medición de una respuesta continua se da
como la actividad de deambular un animal el instrumento más usual es la rueda de actividad, una
rueda en la que deambula el animal y que va girando conforme el animal camina. La tasa de
respuesta, por tanto, puede significar el número de veces que se ejecuta una conducta, la velocidad
de realizar una conducta, el espacio a lo largo del cual se ejecuta una conducta. Otro parámetro es
la latencia de la respuesta, tiempo que pasa desde que el sujeto se encuentra en la situación hasta
que emite la respuesta. En estos parámetros también se encuentran número de ensayos, intervalo
entre ensayos, magnitud y demora del refuerzo. Bhurrus F. Skinner (1904-1990) consigue explicar
la llamada ley del efecto de Thorndike, con respecto a que toda conducta reforzada tiende a
repetirse. Para sus primeros experimentos con ratas y luego con palomas, diseña la cámara
operante, mejor conocida como caja de Skinner, que cuenta con una serie de módulos para la
representación de estímulos, como un comedero, una rejilla que da pequeñas descargas eléctricas
en el piso, y uno de los más comunes es la palanca de respuesta. En una prueba realizada en 1997,
por Roberto Álvarez, mostraron que efecto tiene la devaluación del reforzador, en condiciones de
condicionamiento instrumental, en ratas como organismos de prueba, en donde demostraron que
la ejecución instrumental depende también de un proceso precio de aprendizaje de incentivo. Si
una rata en la caja de Skinner aprende que una luz anuncia la llegada de la comida, se reforzara por
encender la luz, que se convierte en un reforzador secundario asociado con la comida. Existen otros
tipos de reforzadores: inmediatos y retardados; mientras más tarde en llegar el reforzador, al menos
en el caso de las ratas, es menos probable que se logre un aprendizaje o asociación, algo que difiere
en el caso de los seres humanos, pues el tiempo ya no es factor, al estar consciente de que el
reforzador va a llegar tarde o temprano(Mestre, J.M., Palmero, F, 2004).Para que el reforzamiento
ya sea continuo (reforzamiento de la respuesta deseada cada que esta tiene lugar) o parcial
intermitente (refuerzo de una respuesta que ocurre solo algunas veces, lo que lentifica la
adquisición de la respuesta creando una mayor resistencia a la extinción que el continuo)pueda
moldear o dar paso a una conducta deseada, se lleva a cabo por medio de una programación
adecuada de reforzamiento, lo que Skinner llama como programas de refuerzo. Igualmente fueron
utilizados los postulados de Thorndike que desarrollo una teoría de la conducta basada en los
estudios sobre el aprendizaje y considero a este como un proceso de prueba – error y posteriormente
lo denomino proceso de selección y conexión. Finalizando con observaciones de algunas
diferencias con otras teorías.

El condicionamiento operante es una teoría conductista propuesta por Skinner en los años
treinta, quien publicó ciertos artículos con los resultados que obtuvo en sus estudios de laboratorio
con animales y en estos identificó varios componentes del condicionamiento clásico. Una gran
parte de sus trabajos se encuentra sintetizado en su libro llamado ‘’The Behavior of Organisms’’
(1938). “Las conductas operantes se fortalecen o debilitan por los hechos que siguen a la respuesta.
Mientras que la conducta de respuesta es regida por sus antecedentes, la conducta operante es
controlada por sus consecuencias” (Fadima, Frager, 2002). Lo que quiere decir que, el
condicionamiento operante se corrobora después de la expresión de una conducta, ya que esta es
establecida por medio de reforzadores positivos o negativos. Se llaman operantes porque interviene
en nuestro medio, esto se refiere a que está invadiendo sobre el constantemente a través de lo que
hace. Pero para lograr esto se deben usar algunas técnicas como refuerzos que son como las
consecuencias de una conducta determina su destino, es decir, una consecuencia obtenida de un
comportamiento y que incrementa la posibilidad de repetirlo, se denomina refuerzo, y puede ser
positivo o negativo, (Paladines, 2012). Los refuerzos se refieren a premiar con un estímulo positivo
o negativo la consecuencia de una conducta, es decir, la intención de los refuerzos es incrementar
la posibilidad de que una conducta se repita en un futuro, a través de recompensas. Por esto
podemos encontrar dos tipos de refuerzos: El refuerzo positivo que es el que fortalece cualquier
conducta que la produce (Fadima, Frager, 2002). Es decir, se basa en dar una recompensa para que
la conducta se repita. El refuerzo negativo, que fortalece cualquier conducta que la disminuya o
suspenda. Los reforzadores negativos son aversivos en el sentido en el que son estímulos que la
persona o el animal evita (Fadima, Frager, 2002). Por lo tanto, consiste en quitar algo que no le
agrada a la persona, para que la conducta sea eliminada, es decir, consiste en ausentar un estímulo
desagradable, para que así exista más probabilidades de ejecutar la respuesta anterior. Otra técnica
es el castigo, es la consecuencia derivada de un comportamiento, que disminuye la posibilidad de
que dicho comportamiento se repita” (Paladines, 2012). Es decir, por medio del castigo se obtienen
más probabilidades de que la persona disminuya las conductas anteriores por medio de estímulos
que no le agradan o también al retirar un estímulo agradable. Podemos encontrar dos tipos de
castigo. El castigo positivo, este consiste en suprimir un comportamiento presentándole a la
persona o animal un estímulo que no le agrada, para que así disminuya la frecuencia de esa
respuesta. El castigo negativo, el cual consiste en anular un comportamiento, al eliminar un
estímulo agradable para la persona o animal. Otro factor importante es la extinción la cual se
caracteriza por apartar el reforzamiento que produce una conducta condicionad, pero al extinguir
dicho estímulo la frecuencia que ocasionaba esa conducta también disminuirá y por lo tanto ira
apareciendo la conducta instaurada antes del reforzamiento mencionado anteriormente.

MÉTODO

Sujetos

Un software de una rata virtual llamado Sniffy, con sexo no definido, peso no especificado y raza
sin referencia.

Con este software se aprovecha el alcance de un laboratorio, facilitando el análisis conductual de


la rata al momento de condicionarla, así mismo los avances tecnológicos y pedagógicos para
generar nuevas posibilidades como el software y muchos otros programas con objetivos similares.
Sniffy ha sido de gran ayuda para comprender mejor los fenómenos más comunes del aprendizaje
no asociativo, del condicionamiento clásico y operante.

Instrumentos

El Software Sniffy Pro 2.0, diseñado por Alloway, Wilson y Graham (2006) para el estudio de los
fenómenos más importantes que abarcan los cursos de psicología del aprendizaje. El manual Sniffy:
La rata virtual (Alloway, Wilson y Graham, 2006). El libro Fenómenos básicos de
condicionamiento operante, capítulo 10, del manual de Sniffy La Rata Vitual Pro Versión 2.0,
lápiz, papel, por último, un computador Dell con Intel CORE i5 y sistema operativo de 32 bits, con
soporte para ejecutar el software Sniffy.

Procedimiento

RESULTADOS

1. Entrenamiento en el comedero con SNIFFY (reforzador secundario):

Imagen 1. Sniffy en la caja de Skinner Imagen 2. Histograma de la asociación


que Sniffy entre el Sonido de la palanca
efectuó (EC) y la comida (EI).

1. MOLDEAMIENTO DE LA ACCIÓN DE PRESIÓN DE PALANCA MEDIANTE


SNIFFY.
Imagen 3. Sniffy se está desarrollando Imagen 4. Histograma de la contingencia
la asociación entre la barra y el sonido. entre la respuesta de presionar palanca y
la entrega de comida. Siendo R+ el
sonido de la pal.
2. PROCEDIMIENTO DE EXTINCIÓN DE LA ACCIÓN DE PRESIÓN DE PALANCA
MEDIANTE SNIFFY.

Imagen 5. Se muestre que la tasa de Imagen 6. Histograma que muestra el proceso


respuesta es de aproximadamente 2 de extinción de presión de palanca por parte de
resouestas cada 5 minutos “Sniffy is Sniffy.
responding at rate of 0.4 times per
minute” vaya a “Experiment”

Imagen 7. Registro acumulativo de las respuestas y reforzamientos desde el principio del


experimento hasta el final del mismo.

Preguntas a resolver:
1. Calcular el tiempo que tomó establecer una asociación entre el sonido del comedero y la entrega
de comida.

5= Cantidad de tiempo (minutos) Por cada recuadro.


12= Cantidad de recuadros transcurridos para establecer la asociación.
3= Minutos transcurridos en el recuadro 13.
5*12= 60 min + 3min= 63min-equivale= 1h y 3min: En este momento se ha generado una
contingencia entre el sonido del comedero y la entrega de comida.

2. Calcular el tiempo que tomó el inicio de la asociación entre la palanca y el sonido-comida.

5= Cantidad de tiempo (minutos) Por cada recuadro.


6= Cantidad de recuadros transcurridos para establecer la asociación.
5 * 6= 30min: tiempo transcurrido para establecer una asociación entre el sonido del comedero
(EC9 y la comida (EI).
3. Calcular el tiempo que tomó entrenar correctamente la respuesta de presión de palanca.

5= Cantidad de tiempo (minutos) Por cada recuadro.


5= Cantidad de recuadros transcurridos, que se tomaron para entrenar correctamente la respuesta
de presión de palanca.
5 * 5= 25min: Tiempo transcurrido para establecer un entrenamiento correcto, frente a la
respuesta de presión de palanca.
4. Calcular el tiempo desde que se inicia el procedimiento de extinción hasta que se logra el
criterio de extinción.

5= Cantidad de tiempo (minutos) Por cada recuadro


6= Cantidad de recuadros transcurridos desde que se inició el procedimiento de extinción hasta
que se logra el criterio de extinción (aproximadamente 2 respuestas cada 5 minutos “Sniffy is
responding at a rate of 0.4 times per minute).

2= Minutos aproximadamente transcurridos en el 7 recuadro

5 * 6 = 30min + 2min = 32min tiempo transcurrido desde que se inició el procedimiento de


extinción hasta que se logra el criterio de extinción.
5. Calcular el tiempo total del experimento desde entrenamiento al comedero hasta la extinción.

5= Cantidad de tiempo (minutos) Por cada recuadro.


36= Cantidad de recuadros transcurridos desde el inicio del experimento (comedero) hasta la
finalización de ente (proceso de extinción).
5 * 36 = 180 min----- equivale= 3h tiempo transcurrido desde el inicio del experimento
(comedero) hasta la finalización de ente (proceso de extinción).
6. Calcular la tasa aproximada de respuesta y de reforzamiento, desde la primera respuesta hasta
el inició de la asociación palanca y el sonido-comida.

192= Cantidad de reforzamiento.


30= Tiempo en minutos.
192/ 30 = 6,4: taza aproximada de reforzamiento desde la primera respuesta hasta el inició de
la asociación palanca y el sonido-comida.

0 = Respuestas (el margen de respuestas es continuo-línea recta, no es entendible para medir)


7. Calcular la tasa aproximada de respuesta y de reforzamiento, desde el inició de la asociación
palanca y el sonido-comida hasta que se entrena correctamente la respuesta de presión de
palanca.

Reforzamiento:
5= Cantidad de tiempo (minutos) Por cada recuadro.
278= Reforzamientos.
11= Cantidad de recuadros transcurridos desde el inició de la asociación palanca y el sonido-
comida hasta que se entrena correctamente la respuesta de presión de palanca.

5 * 11 = 55min

278 / 55 = 5,05 tasa de reforzamiento desde el inició de la asociación palanca y el sonido-comida


hasta que se entrena correctamente la respuesta de presión de palanca.

Respuesta:

5= Cantidad de tiempo (minutos) Por cada recuadro


71= Respuestas
11= Cantidad de recuadros transcurridos desde el inició de la asociación palanca y el sonido-
comida hasta que se entrena correctamente la respuesta de presión de palanca.

5 * 11 = 55min

71 / 55 = 1,29 tasa de respuesta desde el inició de la asociación palanca y el sonido-comida hasta


que se entrena correctamente la respuesta de presión de palanca.

8. Calcular la tasa de respuesta aproximada desde que se inicia el procedimiento de extinción


hasta el primer retorno de la pluma del registro acumulativo.

5= Cantidad de tiempo (minutos) Por cada recuadro.


55= Respuestas.

5= Cantidad de recuadros transcurridos desde que se inicia el procedimiento de extinción hasta el


primer retorno de la pluma del registro acumulativo.

5 * 5= 25min

55 / 25 = 2,2: tasa de respuesta aproximada desde que se inicia el procedimiento de extinción


hasta el primer retorno de la pluma del registro acumulativo.

Conclusiones

Se entrenó a la rata (SNIFFY) mediante un condicionamiento operante, de manera que el


sonido que se produce al pulsar la palanca actúe como un estímulo condicionado (EC) con un valor
apetitivo, y como tal se utilice como reforzador en fases posteriores. Puesto que la RC que se
estableció es esencialmente una respuesta emocional condicionada (REC) que no va acompañada
de reacciones motrices. A medida que sniffy aumentaba la asociación entre el sonido de la palanca
(EC) y la comida (EI), el histograma correspondiente permite ver el grado de la asociación que se
ha establecido, en sound-food (sonido-comida). Es decir que el tiempo implementado entre el inicio
de la asociación entre la palanca y el sonido-comida corresponde a 1h y 3min, con este tiempo se
ha generado una contingencia entre el sonido del comedero y la entrega de comida, siguiendo a
esto se comienza a analizar los diferentes ensayos teniendo en cuenta el tiempo y las diferentes
asociaciones que alcance a tener la rata, como el tiempo que tomó el inicio de la asociación entre
la palanca y el sonido-comida con un tiempo de 30 minutos que fueron el tiempo transcurrido para
que se evidenciara la asociación entre el sonido del comedero (EC) y la comida (EI).también se
revisa el tiempo empleado para entrenar la respuesta de la presión de la palanca con un tiempo de
25 minutos para poder establecer un entrenamiento correcto frente a la respuesta. Con estos
resultados podemos concluir las tasas para principalmente el reforzamiento y la respuesta. La tasa
aproximada de reforzamiento desde la primera respuesta hasta el inició de la asociación palanca y
el sonido-comida fue 6,4. Seguido a esto se encuentra la fase de reforzamiento donde la tasa desde
el inició de la asociación palanca y el sonido-comida hasta que se entrena correctamente la
respuesta de presión de palanca para un total de 5,05 y al final en las respuestas con un valor de
1,29 para la tasa de respuesta desde el inició de la asociación palanca y el sonido-comida hasta que
se entrena correctamente la respuesta de presión de palanca.

Aportes del condicionamiento Operante a la Psicología

El condicionamiento operante es la teoría psicológica desarrollada por Skinner, que explica


la conducta voluntaria en relación con el medio ambiente, basándose en un método experimental.
Frente a un estímulo se genera una respuesta voluntaria, la cual posteriormente puede ser reforzada
de manera negativa o positiva, lo que produce que la conducta operante se debilite o se fortalezca.
Schunk (1997) hace referencia al refuerzo como el proceso responsable del fortalecimiento de las
respuestas, aquel que hace posible que se incremente su tasa o hace que sea más probable que se
presente, el reforzador o estimulo reforzante es el acontecimiento que sigue a la respuesta y la
fortalece. Esta teoría ha hecho grandes aportes a la psicología educativos ya que se tiene claro los
procesos que hacen posible el aprendizaje que se espera obtenga el individuo, se dice que el
comportamiento de los estudiantes es una respuesta a su ambiente, donde, todo el comportamiento
es aprendido, por ende cualquier conducta es el resultado de los refuerzos que dicho
comportamiento ha tenido; dicho esto, se les debe brindar a los estudiante un ambiente adecuado
para el reforzamiento de las conductas deseadas y así mismo modificar o debilitar aquellas no
deseadas, la enseñanza debe basarse en consecuencias positivas o reforzamientos positivos y no en
procedimientos aversivos como el castigo. Al momento de la evaluación, se enfatiza en verificar
que se obtenga los comportamientos previamente determinados como los adecuados, dejando de
lado los procesos que intervinieron durante el aprendizaje. Hernández (2008).
REFERENCIAS

Hernández Rojas, G. 2008 Paradigmas en psicología de la educación, México, Paidós.

Schunk H., D. 1997 Teorías del Aprendizaje, México, Pearson

http://documents.tips/documents/condicionamiento-clasico-y-operante-marco-teorico.html

http://biblio3.url.edu.gt/Libros/2012/Teo-Apra/3.pdf

También podría gustarte