UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO

FACULTAD DE PSICOLOGIA Aprendizaje y Conducta Adaptativa II Unidad 1: Condicionamiento Instrumental

Rubén Ortiz Hernández

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL
A diferencia de la conducta refleja o respondiente, que es provocada por estímulos que la anteceden y es insensible a sus consecuencias, la conducta operante o instrumental se caracteriza porque:  a) No es provocada sino emitida (orientada a metas). metas). 


b) Tiene control sobre las consecuencias y a su vez es determinada por ellas.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL
El estudio de la conducta instrumental se remonta a los trabajos de Thorndike (1898, 1911) sobre la inteligencia animal en las cajas problema. En su preparación, un gato privado de alimento era introducido en una caja que podía abrirse mediante una respuesta o secuencia de respuestas de complejidad variable.  

en algún momento el animal realizaba la respuesta requerida.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL Por ensayo y error. Thorndike llevaba un registro sistemático del tiempo (latencia) que tardaba el animal en cada ensayo en dar la respuesta requerida para escapar.   . que tenía como consecuencia inmediata el escape del encierro y el acceso a comida fuera de la caja.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL Conforme transcurrían los ensayos. la latencia del escape disminuía. las respuestas que sean seguidas de un evento satisfactorio se repetirán en circunstancias similares. Thorndike sistematizó sus observaciones en su Ley del Efecto: Efecto: ³En una situación estímulo determinada. mientras que las que sean seguidas por un evento desagradable tenderán a desaparecer´   . lo que es un indicador del aprendizaje del animal.

desagradable. Su ³Ley del Efecto´ sólo pretendía describir la relación observada entre la conducta emitida en ciertas condiciones estímulo y sus consecuencias.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL Pese a las connotaciones de los términos elegidos (satisfactorio. etc) Thorndike insistió en evitar las explicaciones antropomórficas en términos de razonamiento o de emociones.   .

es decir. su respuesta a la interrogante de qué es lo que se aprende era una conexión estímulo-respuesta (E-R). Su función consistía simplemente en ³fortalecer´ o ³debilitar´ la conexión entre el estimulo previo y la respuesta.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL Siguiendo la tendencia dominante en la época. estímulo(Ela conexión entre la situación estímulo previa y la respuesta dada por el organismo en esa situación.  .  En su esquema. la consecuencia (o efecto) no formaba parte de la relación aprendida.

 .APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL  La situación experimental de Thorndike (la caja problema) se conoce como ensayo discreto caracterizado porque permite una sola respuesta por ensayo (tanto en la caja problema como en los laberintos el animal es sacado del aparato en cuanto da la respuesta) . Dicha característica implica que las medidas apropiadas del aprendizaje son la latencia o la velocidad de la carrera.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL  B. que permite al organismo operar en el ambiente y producir cambios que a su vez determinan la probabilidad de que dicha conducta se repita. F. Skinner acuñó el término conducta operante para referirse a la conducta no provocada. .

Aunque ambos términos hacen referencia al efecto de la conducta en el medio. por considerar que ésta última instrumental.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL  Skinner prefería el término conducta operante (una clase de respuestas cuya pertenencia a la clase es determinada por el efecto específico sobre el medio) al de conducta instrumental. hacía referencia a un propósito.  . la conducta instrumental (a diferencia de la operante) incluye además características como la topografía o forma de la conducta.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL A diferencia de la preparación de ensayo discreto empleada por Thorndike. Skinner diseñó una preparación conocida como operante libre que permite el estudio más continuo de la conducta ya que no impone restricciones a la emisión de la respuesta operante.  .  Lo anterior implicó el uso de otras medidas del aprendizaje (como la frecuencia o la tasa de respuestas) respuestas) en lugar de la latencia o la velocidad.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL Términos de Thorndike Estado placentero o satisfactorio Términos de Skinner Estímulo reforzador positivo Términos de Domjan Estímulo apetitivo Estímulo aversivo Estado Estímulo desagradable o aversivo o molesto reforzador negativo .

PROCEDIMIENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Procedimiento Contingencia Tipo de estímulo Resultado Reforzamiento positivo Positiva: la conducta suma (+) un estímulo Reforzador positivo o estímulo apetitivo Aumenta la probabilidad de la conducta Aumenta la probabilidad de la conducta Reforzamiento negativo Negativa: la Estímulo conducta evita o aversivo termina (-) un (estímulo .

¿RDO?) Reforzador positivo o estímulo apetitivo .PROCEDIMIENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Procedimiento Contingencia Tipo de estímulo Resultado Castigo positivo Positiva: la conducta suma (+) un estímulo Negativa: la conducta resta (-) un estímulo Estímulo aversivo Disminuye la probabilidad de la conducta Disminuye la probabilidad de la conducta Castigo negativo (costo de respuesta.

En caso contrario debe ³moldearse´ por medio del Reforzamiento diferencial (combinación de reforzamiento y extinción) de aproximaciones sucesivas a la conducta meta.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL  Para poder reforzar una conducta es necesario que esté presente en el repertorio del sujeto o que se realice con la frecuencia suficiente para poder reforzarla. .

.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: CONDICIONAMIENTO INSTRUMENTAL     El moldeamiento supone: a) El planteamiento de la meta conductual b) Evaluación del nivel inicial del desempeño c) Dividir el entrenamiento en pasos (o aproximaciones sucesivas) a la conducta meta.

.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Aunque los hallazgos confirman la idea de Thorndike y Skinner de que el reforzamiento fortalece una respuesta particular (el desarrollo de una respuesta estereotipada). Neuringer demostró la posibilidad de incrementar la variabilidad (creatividad) de la respuesta si se exige dicha variabilidad como requisito para el reforzamiento.

Breland y (arrastre Breland.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Así como en el condicionamiento clásico se demostró que ciertos aprendizajes eran más sencillos (por ejemplo. también en el condicionamiento instrumental se encontró que el aprendizaje depende de la relevancia o pertinencia entre respuesta y reforzador. por ejemplo. 1961) . la imposibilidad de reforzar bostezos con el escape (Thorndike) o la intromisión de conductas instintivas en una secuencia aprendida (arrastre instintivo. aversión condicionada al sabor) o difíciles que otros (como la asociación entre un sabor y una descarga).

. Shettleworth. 1989. si el animal se encuentra en un estado motivacional (por ejemplo hambre) y en una situación en que puede encontrar el reforzador necesario. 1975) propusieron la aplicación de la teoría de los sistemas de conducta a la conducta instrumental. se activa el sistema conductual pertinente.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL   Diversos autores (Timberlake y Lucas. por lo que el animal empieza a emitir las conductas del sistema. Según dicha teoría.

de otro modo.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Si al sistema conductual activado se le sobrepone un condicionamiento instrumental. . la efectividad del procedimiento para fortalecer la conducta instrumental exigida dependerá de la compatibilidad de dicha conducta con el sistema activado. las respuestas del sistema activado irrumpirán en la secuencia desplazando a la respuesta reforzada.

 En una caja inclinada se liberaba un balín que rodaba de un extremo a otro y salía por un hoyo.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Timberlake et al (1982) probaron dicha predicción en un procedimiento que comparaba procedimientos de condicionamiento instrumental y condicionamiento clásico. Las condiciones experimentales eran las siguientes:  .

aunque no fuera necesario Algunas incluso se lo llevaban a la boca (lo trataban como si fuera comida. como en el arrastre instintivo) instintivo) Condicionamiento clásico . El animal no tenía que responder En ambos grupos las ratas tocaban y manipulaban el balín.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Procedimiento Descripción Resultados Condicionamiento operante Los animales debían hacer contacto con el balín para obtener la comida Se asociaba la presencia del balín (EC) con la comida (EI).

. los organismos prefieren trabajar por reforzadores más grandes y de mayor calidad. Cambios en la cantidad o calidad del reforzador: los organismos han demostrado ser sensibles a los cambios entre lo que recibían antes y lo que reciben ahora. b. Cantidad y calidad del reforzador: en igualdad de condiciones.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL    Algunas de las variables relacionadas con el reforzador que influyen en el aprendizaje son: a.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Crespi (1942) fue el primero en describir los efectos del cambio en la cantidad o calidad del reforzador: Los organismos que pasan de una recompensa grande (digamos 22 pellas) a una pequeña (digamos 2 pellas) muestran un deterioro en su desempeño en comparación con los que siempre han recibido la recompensa pequeña (CONTRASTE CONDUCTUAL (CONTRASTE NEGATIVO) NEGATIVO)  .

POSITIVO). esto puede deberse a un efecto ³de techo´  .APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Los organismos que pasan de una recompensa pequeña (digamos 2 pellas) a una recompensa grande (digamos 22 pellas) muestran una mejora en su desempeño en relación con los que siempre recibieron la recompensa grande (CONTRASTE CONDUCTUAL (CONTRASTE POSITIVO).  Si bien es más común el hallazgo del contraste negativo que del positivo.

Los estudios de Skinner sobre conducta supersticiosa y los hallazgos sobre los efectos de la demora del reforzamiento apuntan a la importancia de una relación de contigüidad (cercanía temporal) entre respuesta y reforzador.  . a.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Otra variable que tiene una influencia definitiva en el aprendizaje es el tipo de relación entre respuesta y reforzador.

pueden usarse reforzadores condicionados o sistemas de marcado que faciliten la identificación de la respuesta reforzada y permitan salvar el lapso temporal entre respuesta y consecuencia.  . una de las cuales coincide con la consecuencia. Para evitar esa dificultad. al aprendiz le resulta difícil identificar la respuesta que ocasionó la consecuencia (antes de presentar el reforzador o el estímulo aversivo) pueden ocurrir muchas respuestas.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  En los casos en que la consecuencia (reforzamiento o castigo) es demorada.

A pesar de que el reforzamiento era ³gratuito´. las aves desarrollaron ³manerismos´ que Skinner atribuyó al ³manerismos´ reforzamiento accidental. 15´).   . de ahí el nombre de conducta supersticiosa.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL En su experimento sobre conducta supersticiosa Skinner (1948) entregaba comida cada 15´ a palomas que no tenían que hacer nada para obtenerla (programa no contingente de TF 15´).

.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Su conclusión fue que la condición necesaria y suficiente para aprender era la contigüidad entre respuesta y reforzador. sin que fuera menester la existencia de una relación causal (de contingencia) entre ellos.

 El hallazgo principal de esta repetición fue la observación de que la presentación periódica de reforzadores daba lugar a una organización temporal de la conducta en dos categorías principales:  .APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL La repetición del experimento de superstición por John Staddon y Virginia Simmelhag (1971) obligó a replantear las conclusiones de Skinner.

ocurridas sobre todo al final terminales. cuando era inminente la entrega del reforzador.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Conductas interinas: ocurridas sobre todo a la mitad interinas: del intervalo entre presentaciones del reforzador.   . Conductas terminales. del intervalo. e inmediatamente después de la entrega.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Las respuestas interinas y terminales eran similares entre todas las aves. Staddon y Simmelhag concluyeron que las respuestas terminales son respuestas innatas en anticipación del reforzamiento y que las interinas obedecen a otras fuentes de motivación. Staddon y Simmelhag no encontraron evidencia de reforzamiento accidental.   . y a diferencia de Skinner.

dicho sistema incluye:  .APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Trabajos posteriores condujeron a reinterpretar los resultados de Staddon y Simmelhag en el contexto de la teoría de sistemas según la cual. la presentación del EI (o reforzador primario) activa el sistema de conducta pertinente para ese estímulo.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL PRESENTACIÓN DEL EI CONDUCTAS DE BÚSQUEDA GENERAL CONDUCTAS DE BÚSQUEDA FOCALIZADA CONDUCTA CONSUMATORIA .

la presentación de diferentes EI debería activar sistemas distintos y por ende. deberían observarse respuestas diferentes. Según esta teoría. la presentación periódica de comida activa el sistema motivacional alimenticio junto con las respuestas preorganizadas y específicas de la especie.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Según la interpretación de la teoría de sistemas. predicción confirmada por la investigación posterior  .

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL  Otra variable fundamental para el aprendizaje es la existencia de una relación de contingencia (causalidad) entre la respuesta y su consecuencia (reforzamiento o castigo). la relación de contingencia implica que la respuesta controla la consecuencia de la misma (el reforzamiento o el castigo deben ser más probables en presencia que en ausencia de la conducta)  . En esencia.

 Mediante un diseño triádico.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Una evidencia importante sobre la sensibilidad de los organismos a la contingencia entre respuesta y consecuencia (o controlabilidad de las consecuencias) proviene de los estudios de Seligman. Overmier y Maier en el campo del DESAMPARO APRENDIDO.  . demostraron que la experiencia previa de control o falta de control sobre los eventos importantes determina la posibilidad del aprendizaje posterior.

APRENDIZAJE Y CONDUCTA ADAPTATIVA II: DISEÑO TRIÁDICO Grupo Grupo de escape Grupo acoplado Grupo control Fase de Fase de exposición condiciona miento Resultado Aprendizaje rápido Aprendizaje lento Aprendizaje rápido Descarga escapable Descarga inescapable Entrenamiento escapeescapeevitación Entrenamiento escapeescapeevitación Sin descarga. Entrenamiento escapeconfinado en escapeevitación el aparato .

 La hipótesis del desamparo aprendido es el intento de explicar el hallazgo asumiendo que dado que los animales pueden percibir la existencia o inexistencia de una relación de contingencia en el fenómeno de desamparo aprenden que nada de lo que hagan podrá controlar lo que sucede en su vida.  El efecto del desamparo aprendido es la descripción de que la exposición a una descarga incontrolable impedía o dificultaba luego el aprendizaje posterior.APRENDIZAJE Y CONDUCTA ADAPTATIVA II: ELEMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL Es importante distinguir entre el efecto y la hipótesis del desamparo aprendido.  .

Sign up to vote on this title
UsefulNot useful