Está en la página 1de 7

Comportamiento Organizacional

ESTRATEGIA DE REFORZAMIENTO Y
SEMANA 4
APRENDIZAJE

[COMPORTAMIENTO ORGANIZACIONAL]
ESTRATEGIAS DE REFORZAMIENTO Y A PRENDIZAJE

Ivan Pavlov estudió el condicionamiento clásico que es una forma de aprendizaje por medio
de la asociación y que implica la manipulación de un estímulo para influir en la conducta. Se
enseñó a los perros a salivar cuando sonaba la campana, la cual sonaba en av iso al inminente
alimento. La vista de la comida provocaba de manera natural que los perros salivaran.
Eventualmente, los perros aprendieron a asociar el sonido de la campana con la
presentación de la carne y a salivar cuando solamente sonaba la campana. Este aprendizaje
por medio de la asociación es tan común en las organizaciones que muchas veces es
ignorado hasta que causa una considerable confusión.

La clave es comprender qué es un estímulo y qué es un estímulo condicionado. Un estímulo


es algo que incita la acción y provoca una respuesta (la carne para los perros). El truco es
asociar un estímulo neutral (la campana sonando) con otro estímulo inicial que ya afecta la
conducta y produce respuesta (la comida). El estímulo que una vez fue neutral se llam a
estímulo condicionado cuando afecta la conducta en la misma forma que el estímulo inicial.

B.F Skinner estudió el condicionamiento operante. Incluye más que un estímulo y su


conducta de respuesta. Es el proceso de controlar la conducta manipulando sus
consecuencias. El condicionamiento clásico y operante difieren en dos formas importantes:

1. El condicionamiento operante demanda el examen de antecedentes, conducta y


consecuencias. El antecedente es la condición que conduce o “da pie” a la conducta. Por
ejemplo, un acuerdo entre un jefe y un empleado para trabajar tiempo extra cuando sea
necesario es un antecedente. Si el empleado trabaja, esto es la conducta, mientras que la
consecuencia es el elogio del jefe.

Si un jefe desea que una conducta se repita, como trabajar tiempo extra, debe manipular las
consecuencias. El fundamento para esto es la ley del efecto de Thorndike: la ley de la
conducta que da por resultado una consecuencia agradable tenderá a repetirse, mientras

2 [ POLITÉCNICO GANCOLOMBIA NO EN A LIANZA CON WHITNEY IN TERNA TIONA L SYSTEM ]


que la conducta que da por resultado una consecuencia desagradable tenderá a no repetirse.
Si como supervisor se desea que la conducta se repita, deberá hacer que las consecuencias
para el individuo sean positivas.

La importancia está en las consecuencias que pueden manipularse antes que en las
inherentes a la conducta misma. Las recompensas intrínsecas son resultado del trabajo
valorado de manera positiva que alguna otra persona otorga al individuo. Son importantes
reforzadores externos o consecuencias del entorno que pueden influir sustancialmente en el
comportamiento de trabajo de una persona por medio de la ley del efecto. Algunas de éstas
son recompensas ideadas o planeadas que tienen costos directos e implicaciones
presupuestarias. Los aumentos de sueldo y los bonos en efectivo son ejemplos.

Las estrategias de reforzamiento: La modificación del comportamiento organizacional es el


reforzamiento sistemático del comportamiento de trabajo deseado y el no reforzamiento o
castigo del comportamiento de trabajo deseado y el no reforzamiento o castigo del
comportamiento de trabajo no deseado. Incluye cuatro estrategias de reforzamiento
básicas:

1. Reforzamiento positivo: Es la administración de consecuencias positivas que tienden


a incrementar la probabilidad de repetición de la conducta deseada en escenarios
similares. Por ejemplo, un jefe asiente con la cabeza a una subordinada para expresar
aprobación después de que ella hace un comentario útil durante una junta. Es
necesario que esté consciente de que los reforzadores positivos y las recompensas
no son necesariamente lo mismo. El reconocimiento, por ejemplo, es tanto una
recompensa como un reforzador positivo potencial. El reconocimiento se convierte
en un reforzador positivo solamente si el desempeño de una persona mejora
posteriormente. Algunas veces las recompensas no se convierten en reforzadores
positivos. Por ejemplo, un supervisor podría elogiar a un subordinado frente a otros
miembros del grupo por descubrir errores en un reporte. Sin embargo, si los

[COMPORTA MIENTO ORGANIZA CIONA L] 3


miembros del grupo le aplican posteriormente la ley del silencio, el trabajo podría
dejar de buscar errores en el futuro.

La recompensa debe otorgarse solamente si ocurre la conducta deseada. Esto es, la


recompensa debe ser contingente a la conducta deseada (Ley del reforzamiento
contingente). Por ejemplo, un elogio de un supervisor contingente a la participación
oportuna de una empleada.

La recompensa debe otorgarse tan pronto como sea posible después de que ocurra la
conducta deseada. A esto se le conoce como la ley del reforzamiento inmediato. En
este punto es importante abordar dos aspectos de implementación: ¿Qué haría si la
conducta se aproxima a lo que desea pero no da exactamente en el blanco? ¿Es
necesario proporcionar reforzamiento todas y cada una de las veces?

2. Moldeamiento: Si la conducta deseada es de naturaleza específica y difícil de lograr,


se puede utilizar este patrón de reforzamiento positivo de aproximaciones sucesivas
que conducen a la conducta deseada. Por ejemplo, los nuevos operadores de
máquinas en la fundición de Ford Motor Company en Ohio deben aprender una serie
compleja de tareas para vender metal fundido en la fundidora y evitar rebosamientos
o cuarteaduras. Los moldes se llenan siguiendo un proceso de tres pasos, cada uno de
ellos más difícil que el anterior. Primero, hábiles maestros fundidores le muestran a
los aprendices el primer paso del vertido para fundición y los elogian con base en qué
tan bien lo hagan. Conforme los aprendices ganan experiencia, solamente reciben
elogios cuando todos los elementos del primer paso se completan con éxito. Una vez
que los aprendices dominan el primer paso avanzan al segundo. El reforzamiento se
da solamente cuando todo el primer paso y un aspecto del segundo se completan de
manera exitosa. Con el tiempo, los aprendices dominan los tres pasos en su totalidad

4 [ POLITÉCNICO GANCOLOMBIA NO EN A LIANZA CON WHITNEY IN TERNA TIONA L SYSTEM ]


y se les otorgan recompensas positivas contingentes inmediatamente por una
fundición completa que no tiene defectos.

3. Reforzamiento positivo programado: Éste patrón positivo puede otorgarse de


acuerdo con un programa continuo o intermitente. El reforzamiento continuo otorga
una recompensa cada vez que ocurre una conducta deseada. El reforzamiento
intermitente recompensa la conducta solamente de manera periódica. Estas
alternativas son importantes debido a que ambos programas pueden tener impactos
muy diferentes sobre la conducta. El reforzamiento continuo produce una conducta
deseada más rápidamente que el reforzamiento intermitente. En el ejemplo de la
capacitación inicial de los fundidores aprendices, el reforzamiento continuo es más
costoso en el consumo de recompensas y se extingue más rápidamente cuando el
reforzamiento ya no está presente. En tanto, la conducta adquirida bajo el
reforzamiento intermitente se mantiene durante más tiempo después de la
interrupción de éste; lo contrario sucede con la conducta adquirida por reforzamiento
continuo. En otras palabras, es más resistente a la extinción. Así, cuando los
aprendices dominan un aspecto del vertido, el programa se cambia del reforzamiento
continuo al reforzamiento intermitente.

El reforzamiento intermitente se puede otorgar de acuerdo con un programa fijo o


variable. Los programas variables tienen como resultado patrones más consistentes
de una conducta deseada que los programas de reforzamiento fijo. Los programas de
intervalo fijo otorgan recompensas en la primera aparición de una conducta después
de que ha transcurrido un tiempo determinado. Los programas de tasa fija tienen
como resultado una recompensa cada vez que un cierto número de conductas han
ocurrido. Un plan de intervalo variable recompensa la conducta en periodos
escogidos al azar, mientras que un plan de tasa variable lo hace después de ocurrido
un número de sucesos al azar. Por ejemplo, cuando los aprendices perfeccionan su

[COMPORTA MIENTO ORGANIZA CIONA L] 5


técnica para una etapa de vertido para fundición, los maestros expertos cambian a un
programa de reforzamiento de tasa variable.

La compañía Drankenfeld Colors deseaba utilizar el reforzamiento positivo para


exhibir una asistencia perfecta, aun cuando la asistencia ya era muy positiva. Otorgó
recompensas monetarias de $50 por una asistencia perfecta en 6 y 12 meses, con un
bono de $25 por un año completo de asistencia perfecta. Además, todos los
empleados con asistencia perfecta entraron en un sorteo realizado en una fiesta. La
asistencia perfecta se incrementó del 44 % al 62 % en el primer año del programa.

En el caso citado se utilizó un programa de tasa fija, conjuntamente con un plan de


tasa variable. El primer programa recompensó las conductas de asistencia que
ocurrieron en un periodo de 6 a 12 meses, o el número específico de días laborales
dentro de esos períodos. De esta manera, por cada periodo durante el cual se dio un
número perfecto de días de asistencia, la persona recibió un premio (un programa de
tasa fija).

El segundo programa se centró en la elegibilidad para el sorteo. Se trata de una tasa


variable porque debe cumplirse un número al azar de días de asistencia perfecta antes
de que un empleado específico reciba un viaje.

4. Reforzamiento negativo (evitación): El retiro de consecuencias negativas, lo cual


tiende a incrementar la probabilidad de repetición de la conducta deseada en
escenarios similares. Por ejemplo, un gerente le llama la atención regul armente a un
trabajador por su desempeño deficiente y posteriormente deja de reprenderlo
cuando su trabajo es satisfactorio. Es necesario centrarse en dos aspectos: Las
consecuencias negativas seguidas por su remoción cuando ocurre la consecuencia
deseada. El término reforzamiento negativo proviene de esta remoción de las
consecuencias negativas. Esta estrategia recibe también el nombre de evitación

6 [ POLITÉCNICO GANCOLOMBIA NO EN A LIANZA CON WHITNEY IN TERNA TIONA L SYSTEM ]


debido a su intento de que la persona evita la consecuencia negativa por medio del
desempeño con la conducta deseada.

5. Castigo: Con el castigo no se pretende estimular una conducta positiva sino


desalentar la conducta negativa. Según su definición formal, castigo es la
administración de consecuencias negativas o la remoción de consecuencias positivas
que tienden a reducir la probabilidad de repetición de la conducta en escenarios
similares. Por ejemplo, un gerente que le asigna a un trabajador que llegó tarde un
trabajo desagradable como limpiar baños. Un ejemplo de remoción de consecuencias
es cuando un gerente descuenta una parte del salario de una empleada cuando ésta
llega tarde.

El castigo puede compensarse con el reforzamiento positivo recibido de otra fuente.


Es posible que un trabajador reciba reforzamiento de sus compañeros al mismo
tiempo que recibe el castigo del gerente, lo que provoca que la conducta no deseada
se mantenga.

6. Extinción: Es la remoción de las consecuencias reforzantes para una conducta


determinada. Por ejemplo, un empleado puede llegar tarde al trabajo, y sus
compañeras lo encubren (reforzamiento positivo). El gerente ordena a los
compañeros de trabajo de éste que deben encubrirlo retirando así las consecuencias
reforzantes. El gerente ha utilizado deliberadamente la extinción para librarse de una
conducta no deseada. Ésta estrategia disminuye la frecuencia de la conducta, o la
debilita. La conducta no se “desaprende” sino que simplemente ya no se muestra.
Debido a que la conducta deja de reforzarse, reaparecerá nuevamente si vuelve a
reforzarse. Mientras que el reforzamiento positivo busca establecer y mantener la
conducta de trabajo deseada, la extinción pretende debilitar o eliminar la conducta no
deseada.

[COMPORTA MIENTO ORGANIZA CIONA L] 7

También podría gustarte