Está en la página 1de 11

Tipos de refuerzo: concepto y

índices de refuerzo
1 comentario

Por Equipo editorial. 27 febrero 2018

Skinner al tratar sobre las respuestas operantes dirá: "Una


operante es una parte identificable de la conducta de la que
puede decirse, no que sea imposible hallar un estímulo que la
provoque (....) sino que, en las ocasiones en que se observa
su ocurrencia, no puede detectarse ningùn estímulo
correlacionado.
El formulador de la ley del efecto fue E. L. Thorndike (1874-
1949). Thorndike defiende que en aquellas situaciones en las
que la desaparición de una estimulación aversiva produce un
estado "satisfactorio", los efectos reforzantes de este tipo
de situaciones deberían interpretarse como la primera
formulación de la ley del efecto; esto es, aquéllas en las que
la desaparición de la estimulación aversiva sea gratificante,
deben ser interpretadas como una bùsqueda en la
desaparición de esta estimulación.
También te puede interesar: Concepto y teorías de la
Motivación
Índice
1. Introducción al problema del refuerzo
2. Conceptos básicos, tipos de refuerzo
3. Índices de refuerzo
4. Relaciones empíricas con refuerzo positivo

Introducción al problema del refuerzo


Al siguiente hecho lo denominaremos la ley empírica del
efecto: empíricamente, la consecuencia que una respuesta
lleva consigo es un determinante poderoso de si la respuesta
se fijará o no B.F. Skinner (1904) ha sido quien se ha
ocupado más sistemáticamente en sacar el máximo partido
posible de la formulación empírica de la ley del efecto desde
finales de los años 30 con una postura teórica que se ha
calificado algunas veces como "empirismo descriptivo
sistemático". Frente a la
conducta "respondente" (controlada por condicionamiento
clásico), Skinner propone la "operante", emitida por el
organismo de modo espontáneo. El acercamiento skinneriano
al problema del refuerzo no es teórico en el sentido
tradicional sino empírico-descriptivo.
A nivel descriptivo, algunos eventos que siguen a las
respuestas tienen el efecto de incrementar la probabilidad de
que estas respuestas se repitan. Estos eventos son definidos
e identificados como refuerzos o reforzadores, en función de
sus efectos observables y no en función del efecto que
puedan tener sobre los mecanismos y procesos "internos" del
organismo, sean éstos neuronales o no. Estos eventos,
denominados refuerzos o reforzadores, pueden ser de dos
tipos:
 Refuerzo positivo: "Aquel cuya presencia fortalece o
incrementa la probabilidad de que una acción aparezca en el
futuro".
 Refuerzo negativo: "Aquel cuya desaparición fortalece o
incrementa la probabilidad de que una acción aparezca en el
futuro (justo la que ha llevado consigo o se relacione con la
desaparición de la estimulación aversiva)".
Tanto en Skinner como en Thorndike, la acción del refuerzo
es automática y, en principio, al margen de la conciencia y/o
actividad consciente del organismo. El refuerzo actúa de
modo automático.

Conceptos básicos, tipos de refuerzo


Se estudia como un acontecimiento que aparece
espontáneamente con una frecuencia dada". Las respuestas
operantes pueden ser divididas
en instrumentales y consumatorias:
 Respuesta instrumental: "Cuando es realizada por un
organismo y se encuentra encaminada a la consecución de
una meta".
 Respuestas consumatorias: "Aquellas respuestas que
realiza un organismo justo en la consecución de la meta
(comer, copular, beber, etc.)".
Para llevar a cabo el análisis de las respuestas nos interesa
distinguir dos conceptos:
1. Tasa: Es el nùmero de respuestas que se da por unidad de
tiempo y se presenta usualmente mediante gradientes de
adquisición o extinción (se dice, así, que una respuesta
posee una tasa o un gradiente más acelerado o más
pronunciado que otra).
2. Nivel asintónico de respuesta: Es el nivel máximo de
adquisición y que no se incrementa con posteriores intentos.
Otra división que podemos hacer sobre los refuerzos es ésta:
1. Refuerzos primarios: Aquellos que poseen un valor
reforzante biológicamente determinado y no por aprendizaje,
tal y como ocurre en el caso del aire, comida y bebida.
2. Refuerzos secundarios: Aquellos que han adquirido su
valor por aprendizaje tales como la recompensa social
(alabanza) o el dinero.
Condicionamiento instrumental Se distinguen cuatro tipos de
condicionamiento instrumental (uno positivo y tres negativos)
El entrenamiento de recompensa: El refuerzo utilizado es
positivo y no se encuentra presente antes de la realización de
la respuesta deseada. En cuanto aparece la respuesta se
aplica el refuerzo. Por ejemplo: cada vez que una rata
apretaba una palanca se presentaba, en un cánula, una
pastillita o un grano de comida.
El entrenamiento de castigo: El refuerzo (estímulo punitivo)
no se encuentra presente. Si el sujeto realiza una acción
prefijada aparece el refuerzo negativo (estímulo punitivo). P.
ejem: Un hijo de cinco años rompe un jarrón valioso para la
madre y ésta le da un bofetón.
Los diseños de evitación: El refuerzo aversivo se encuentra
ausente antes de la realización de la conducta, la realización
de la respuesta adecuada lleva consigo que el refuerzo no se
presente. P. ejem: el diseño de evitación de Sidman en el que
se encuentra programada la aplicación de un shock eléctrico
en una caja de Skinner cada 5 segundos, a menos que el
animal (usualmente una rata) apriete una palanca. La
respuesta de apretar la palanca desconecta el circuito y el
animal no recibe el shock.
Los diseños de escape: El refuerzo aversivo se encuentra
presente antes de la realización de la respuesta, la
realización de esta respuesta lleva aparejada la desaparición
de la estimulación aversiva. P. ejem: En una caja de
lanzadera el animal se encuentra en un compartimento con
rejilla electrificada, aparece el shock eléctrico y la respuesta
del animal (saltar por encima de la barrera que separa los dos
compartimentos) lleva consigo la eliminación de la
estimulación aversiva.

Índices de refuerzo
Indices de refuerzo Se denominan índices de refuerzo a los
modos de presentación de estos refuerzos dentro de un
experimento. Los podemos dividir en:
Índices no intermitentes: La aplicación continua de refuerzos
para cada respuesta que aparece (ya sea que adquiere o se
extingue).
1. Refuerzo continuo: Cada respuesta emitida por un
organismo es reforzada.
2. Extinción: No se refuerza ninguna respuesta y es un
proceso similar al de extinción experimental en el
condicionamiento clásico.
Índices intermitentes: La aplicación de menos volumen o
nùmero de refuerzos que respuestas realizadas. Por razones
de espacio solo comentaremos los índices intermitentes
simples; se trata de índices relacionales entre respuestas y
refuerzo o entre tiempo y refuerzo. En el caso de tomar en
consideración el número de respuestas se habla de un índice
de razón y si se toma en cuenta un periodo temporal se habla
de un índice de intervalo.
1. Índice de razón fija (RF): Se refuerza la respuesta correcta
que emite el organismo, después de que éste ha realizado un
nùmero determinado de ellas.
2. Índices de razón variable (RV): A diferencia del caso
anterior, la razón de respuesta/refuerzo es una serie aleatoria
alrededor de un valor central y con un pequeño rango de
variación.
3. Índices de intervalo fijo (IF): Se refuerza la primera
respuesta correcta que aparece después de un intervalo
temporal dado (normalmente en minutos).
4. Índice de intervalo variable (IV): Los refuerzos se
presentan en función de una serie aleatoria de intervalos
temporales y de los que ùnicamente se hace explícito el
intervalo medio.

Relaciones empíricas con refuerzo


positivo
Una de las principales teorías sobre la extinción es la de la
extinción como interferencia de respuestas. En estas teorías
la idea básica es que "la extinción no se produce debido a
una inhibición y/o supresión de respuestas sino a que el
sujeto aprende una respuesta alternativa que interfiere o
compite con la anterior". La alternativa teórica más difundida
es la llamada hipótesis de la frustración.
La idea central es que durante el periodo de adquisición el
sujeto aprende la respuesta apropiada y, además, a esperar
la recompensa que sigue a la respuesta. En el proceso de
extinción, la experiencia de no recibir la recompensa es la
que produce una frustración. Esta frustración sería la
responsable de que el sujeto se comprometiese en la
realización de otras respuestas. A través de varias
demostraciones experimentales se ha constatado que:
1. La frustración procedente de respuestas no reforzadas
positivamente actúa como un energizador de la conducta.
2. Existe una relación directa entre la cantidad de frustración
(medida en criterios tales como velocidad de carrera) y la
reducción de recompensa correspondiente a este intento.
3. Existe una relación entre la intensidad de la frustración, el
retraso en la recepción de la recompensa y número de
intentos de adquisición.
4. La frustración posee componentes aversivos de modo que
algunos autores la han asimilado a diseños de castigo.
Este artículo es meramente informativo, en Psicología-Online
no tenemos facultad para hacer un diagnóstico ni recomendar
un tratamiento. Te invitamos a acudir a un psicólogo para que
trate tu caso en particular.
Si deseas leer más artículos parecidos a Tipos de refuerzo:
concepto y índices de refuerzo, te recomendamos que
entres en nuestra categoría de Psicología básica.

TIPOS DE REFUERZOS DE
LA CONDUCTA
Puede que a veces nos hayamos preguntado por qué los niños y niñas tienden a repetir
algunas conductas. Todas las personas llevamos a cabo diferentes conductas, cuando
hacemos una conducta tenemos una intención, pero lo importante de la conducta es el
refuerzo que tiene después. Es decir, lo que importa es lo que el niño o niña obtiene al
realizar la conducta. Es lo que se conoce como reforzadores de la conducta.

¿Qué son los reforzadores de la conducta?


Los reforzadores son las consecuencias inmediatas a la conducta. Serían, todo aquello que
ocurre justo después de la conducta y que contribuye a que se repita o a que poco a poco
se vaya reduciendo.

Veamos un ejemplo: Cuando el niño o niña realiza una acción, a continuación ocurre algo,
si es algo bueno de alguna manera para el niño o la niña, tenderá a repetir esa conducta
para conseguir eso bueno. En cambio, si es algo malo el niño o la niña, tenderá a extinguir
la conducta para evitar la ocurrencia de aquello que no puede.
Tipos de refuerzos de la conducta

Existen diferentes tipos de reforzadores.

 Reforzamiento positivo. Presentación de un estímulo agradable tras la conducta.


 Reforzamiento negativo. Retirada de un estímulo negativo tras la conducta.
 Castigo positivo. Presentación de un estímulo desagradable o aversivo, después de
la conducta para evitar que ocurra.
 Castigo negativo. Retirada de un estímulo agradable, para evitar que se repita la
conducta.
 Extinción. Es la ausencia de consecuencias, ignoramos la conducta del niño o niña
con el objetivo de extinguirla.

Tipos de reforzadores

 Reforzadores primarios, secundarios y generalizados.


 Reforzador primario. Tiene un valor innato o ya está aprendido, por lo que no es
necesario un aprendizaje.
 Reforzador secundario. Es el estímulo que adquiere el valor de reforzador
mediante condicionamiento clásico. Es decir, aparece unido a otro reforzador
primario, hasta que acaba funcionando como el primero.
 Reforzadores generalizados. Son reforzadores asociados a muchos reforzadores
tanto primarios como secundarios.

 Reforzadores extrínsecos e intrínsecos.


 Reforzamiento extrínseco. La administración del reforzador es externo al niño o
niña. Se administra por otra persona. Podemos tener varios tipos: sociales,
materiales, actividades.
 Reforzamiento intrínseco. Es un refuerzo interno. La propia persona valora su
conducta y tiene sentimientos de alegría y orgullo.

Cómo podemos usar los refuerzos con niños y niñas

 En primer lugar identificar los reforzadores. Cada niño o niña, cada persona es
diferente y los reforzadores pueden variar mucho de una persona a otra. Por ello
es fundamental identificar estímulos materiales, actividades, estímulos sociales
que son agradables para cada niño o niña.
 Entregar el refuerzo en el momento adecuado. Es muy importante hacerlo justo
después de la conducta deseada. No podemos hacerlo antes, ni tampoco
demorarlo demasiado en el tiempo. Si no podemos hacerlo en el momento, le
describimos y explicamos en detalle como lo vamos a hacer.
 Definir claramente cuáles son las conductas que van a ser reforzadas y cuál es el
reforzador que usaremos.
 Es aconsejable usar diferentes reforzadores para evitar que estos pierdan su
fuerza.
 Es preferible el uso de reforzadores no materiales.
 Es muy importante aplicar el reforzador solamente con la conducta deseada.

Celia Rodríguez Ruiz. Psicóloga y Pedagoga

@educa_aprende

https://colegiosalesianos.wordpress.com/2017/01/10/tipos-de-refuerzos-de-la-conducta/

Reforzadores primarios
Un reforzador primario es cualquier reforzamiento que no necesita ser aprendido.
Los reforzadores como dinero o un premio se conocen como reforzadores
secundarios. Un reforzador primario está biológicamente arraigado, como el
hambre, el sueño, el oxígeno o el sexo. Un reforzador secundario se aprende,
como el dinero que se puede utilizar para intercambiar por un reforzador primario.
Usar una galleta para recompensar a un perro por rodar es un ejemplo de un
reforzador primario. Un estudiante que recibe una A en una prueba para un buen
desempeño es un reforzador secundario porque el símbolo A no puede satisfacer
un impulso biológico.

Ejemplos de reforzadores primarios


Ejemplos de reforzadores primarios incluyen la comida, el agua, el sueño, el
oxígeno y el sexo. El comportamiento que es seguido por la satisfacción de estas
unidades básicas se incrementará.

Reforzadores primarios y el aprendizaje


Los estudios realizados por Thorndike y Skinner han mostrado que privar a un
animal de un reforzador primario, tales como alimento, hasta que se realice un
comportamiento aumentará significativamente ese comportamiento. Un niño que
recibe un juguete o dulce después de una rabieta aumentará su comportamiento
mordaz.

Referencias
 "Psychology, Fourth Edition" (Psicología, cuarta edición); Saul Kassin; 2003

 "Science And Human Behavior" (Ciencia y el comportamiento humano); B.F.


Skinner; 1965

 "Behaviorism" (Comportamiento); John B. Watson; 1924

También podría gustarte