Está en la página 1de 11

') )

~ •.. -:-.-:.-=::::. _ -, .
LELAND C. S\VENS01'4 57

TEORIAS DEL APRENDIZAJE


·\'A\UU5. P5\CULOCIAS UEL SlG L9 xx
¿Cómo aprendemos? La respuesta de Watlon

En primer término, Watson consideró todo aprendizaje como un condiciona.


miento de hábitos. Segundo, pensó que sólo dos leyes básicas bastaban para~escri.
bir las condiciones en las cuales se forman vínculos entie--estimulos y respuestas.
Su primera ley establece que la fuerza de un vinculo depende del número de aparea-
mientos (asociaciones) de estímulo y respuesta (ley de la frecuencia). La segunda
ley sostiene que aqueUa respuesta dada inmediatamente después de un estímulo
dete(IT1inado es la que tiene mayor probabilidad de aparearse con este estímu(o (ley
de proximidad temporol). Del apareamien~ó frecuente de seilales o de respuestas
y señales resulta un condicionaoúento efectivo. El apareamiento, asimismo, alcan-
zará su máxima eficiencia si ambos son presentados casi al mismo tiempo. Aunque
en sus tentativas por reproducir las investigaciones rusas \Vatson tropezó con
algunos fracasos, logró por cierto condicionar un ritmo cardíaco más rapido y (a
retracción de una pata ante un tono presentado antes del shOCK. Sin embargo, en
sus escritos no fO(IT1uló distinción alguna entre los tipos de respuestas. Este enfoque
simplista de la fO(IT1u(ación de la teoría siguió caracterizando la labor de Watson (en
acentuado contraste con los complejos detaUes ofrecidos por Pavlov).

. " La teoría inicial de Watson se sustentó sobre dos leyes del aprendizaje, las leyes de
. "

la frecuencia y de la proximidad temporal. A jL!icio de Watson, la fuerza de un


vínculo E~R .depende de ambos tipos de efectos.

Una explicación pOI" la contigüidad acerca de los


efectos del refuerzo aparente

Watson negó toda importancia a (os efectos del refuerzo (en particular a la "ley
del efecto", propuesta por su rival Thorndike). afirmando que un acto ejecutado
con éxito se convierte tanto en (a respuesta más reciente como en la más frecuente.
Por lo tanto, la recompensa resulta superflua como concepto explicativo. Por
ejemplo, un gala que procura escapar de una caja de truco emite una variedad de
respuestas. Una de ellas finalmente le pe(IT1ite escapar de la caja y de (as sel1ales
asociadas a el1a. Sólo la respuesta exitosa es apareada con la cesación de la exposi-
ción del galo a las señales de la caja, de modo que esta respuesta, una vez conclui·
do el ensayo, siempre es la más recientemente aparead. con aquellas señales. Puesto
que el gato que ha logrado escapar de una caja de truco deja de estar expuesto a sus
señales (por lo menos hasta la siguiente prueba de aprendizaje), la conex.ión entre
esas señales y la respuesta afortunada está protegida contra interferencias. Por otro
lado, todas las conexiones entre las sei\ales de la caja de truco y las respuestas ante-
riores son interferidas por las respuestas siguientes (cada una de las cuales se con- \ .;. .
vierte en la más reciente hasta que es seguida, a su vez, por la respuesta posterior).
(' , - ~.-

58 Teorias del aprendizaje


Warson y Gurhrie 59
Puesto que al menos todo gato mínimamente astuto emite por fm una respuesta
acertada y escapa, esa respuesta siempre es la última de las em.iti~en presencia de j~g:lC con el vello del pubis d~_su m~dre~ lo cual le v3.l1~- ser violcnt:ullente reprendido. lUe
OIJ1guna manera negamos que este epISodIO pueda, en algun otro caso, condicionar el temor:)--
la caja y--se--convierte con rapidez en la asociada Con mayor fuerza. a las $Chales de Si el analista ha pn:parado suficientemente a Albert como para que aceple ele sueño, cuando
la caja . De ello resulta el aumento de la probabilidad de que, en presencia de esas fue recordado, como expUca<:ión de sus tendencias de evitación, y si el :malista tiene la autori-
señales, el animal emita la respuesta acertada; en consecuencia, esta respuesta se dad y la personalidad necesarias para lograrlo, Albert puede quedar plenamente eon .. encid~ de-
toma también más frecuente que cualquier olra respuesta. A medida que esa fre- que el sueño le ha revelado en verdad los factores que causaron su lemor_ (Watson y Rayner.
1920, página 14.)
cuencia aumenta, esa respuesta establece un nexo lan fuerte con el hecho de estar
en una caja de truco, que el gato la emite no bien es puesto en la caja_ CoiDo puede
apreciarse, esta explicación de la habilidad que el g310 demuestra poseer para mejo- Posiciones de J1IaC3'on ante los principales problemas
rar como artista de la fuga de la caja de truco se basa por completo sobre conside-
raciones de frecuencia-proximidad temporal, ante, que sobre la satisfacción o la Naturaleza/crianza. El siguiente pasaje demuestra hasta qué punto se compro-
reducción del i¡JIpulso; metió \Vatson con uná línea ambientalista radical:
En los ú~iimp:s años de. su c. ~rrera aca..dé.mica Watson pareció advertir las ~.. u-
ficiencias de est¿ modelo sLrrlple. En un libro que fublicó en 1919, asignó menor Denme una docena de infantes sanos y bien formados y mi propio mundo cspccílil:o para
importancia al papel de la frec~ncia como principal concepto explicativo y avanzó educarlos, y garantizo que elegiré a cualquiera al u:n y lo fonnaré como par:. que llegue :1 ser
cualquier tipo de especialista que yo pueda decidir: médico, abogado, artista, ~omcrci:lnte y
más en la dirección de los conceptos fisiológicos y conductales propuestos por también. si, incluso mendigo y ladrón. cualesquiera que sean sus talentos, inclinadones, tenden,
. Be.c hterev y Pavlov (HilI, 1971). Para el tiempo de su famoso experimento con el das, aptitudes, vOC3Ciones y la raza de sus anlepa53dos. (Walson, 1924, página 82.) o
- pequeño Albert, realizado con la asistencia de su alllmna Rayner (Watson y Rayner,
1920), Watson estaba en condiciones de explicar la mayor parte de la conducta en
el lenguaje cUldadosa'llente elaborado ~el condiciolllmiento clásico. El cómO del aprrndiuIje. Al principio Watson creyó que los principios de
frecuencia y proximidad temporal bastan para explicar el - condicionamiento.
El caso del "pequeño Albert" Puesto que un acto exitoso es a la vez el más frecuente y el más reciente, \lega
a ser el que más probabilidades tiene de ser repetido en circunstancias similares.
En este experimento con un saludable niño deiUeve meses, el pequeño Albert, Consideró que la teoría de Thorndike (véase el capítulo 3), que pone el acento
inscripto en una nursefí diurna, se empleó coma re
una rata blanca (reuniéndose sobre la satisfacción y la molestia, estaba contaminada por subjetividad residual.
así los dos sujetos favoritos ',de Watson) que prOY!lcó originalmente en el niño el En formulaciones posteriores adoptó la posición pavloviana_ (Hilgard y Bower,
reflejo de orientación y 'de tender la manol. Al teaier Albert la mano hacia la rata, 1975).
se le aplicó el El de hacer sonar una barra de aam golpeándola con un martillo
(véase la figura 2.1), lo cual provocó un reflejo desobresalto, así como llanto (el El qué del aprendizaje. Según Watson, la unidad de aprendizaje consiste en
Rl). Al cabo de seis ensayos, la simple vista de la ra!á:(el EC) bastaba para provocar vínculos · entre estímulos observables y respuestas observables o potencialmente
llanto y evitación. Este efecto se generalizó a los ronejos blancos, así como a los observables. Lo que se aprende es un hábito o un reflejo condicionado consistente
perros y pieles animales de ese color. Cuando Watsrc y Rayner consideraban varios en respuestas musculares esJabonadas.
procedimientos para ~uprimir esa fobia condicionali, el pequeño Albert fue retira-
do de la nurserí por su madre, lo cual impidió proiar cualquiera de esos métodos. Continuidad/discontinuidad. uso de datos animales y determinismo. EI:t ren-
Al concluir su artículo, Watson sugería: diza'e sobreviene or acumulación de la fuerza del hábito. Las manifestaciones
evidentes de comprensión no reflejan más que acumu aciones muy rápidas de fuerza
Dentro de veinte años. los freudianos. a menos que ·o .aquí a entonces sus hipótesis cam~ del hábito, o bien el resultado fmal de pequeños movimientos intencionales, los
bien • .:uando anali.:en el temor que Albert experimenta __ un abrigo de piel de foca -en el cuales crean estímulos producidos por el movimiento que provocan flOalmente la
supue~lo caso de que él se haga analizu a esa edad-, proilii!emente logren uranc:arle el relato súbita respuesta manifiesta. En consecuencia, el aprendizaje siempre es continuo.
de un sueño que. sometido al análisis, demostrará que ABtrt. l.'Uando tenía ~es años. intentó Según Watson, los datos obtenidos de animales se aplican a la conducta humana,
y ésta es determinada por el ambiente.

I Una razón por la cual Watson puede haber prefc:ílo a los infantes y las ralaS como
sujetos es la incapa<:idad de éstos para in trodu<:il COC\lainación verbal en la situadón de
ensayo. Cabe suponer que sujetos adultos habrían persislilfl,en afirmar que tenian imágenes y ....
pensamientos y que sus respuestas verbales hubic,~en intcárido en la necesidad de objetividad
de Wal'on.
) }
Teon'as del aprendiza;e Wafion y Guthrie 61
50

(1924), estudiante que trabajó con Watson después que éste abandonó la.J..oIUls
HoplcinsUl1iYt:rsity: La investigadora comparó varios métodos, en.lce ellos· er·plan
propuesto por Watson ·para condicionar en forma directa el estimulo del miedo a un

~ ~
estímulo positivo, Empleando alimento como estímulo positivo, Mary Cover Jones
i .1 logró ·eliminar un miedo a los ·conejos acercando cada vez más el conejo al sujeto
mientras éste comía, Finalmente, el sujeto superó su "fobia a los conejos" hasta
tal punto que fue capaz de tomarlos en sus manos. Prefigurando la técnica de mode· .
lación de Bandura (capítulo 9), la investigadora también logró vencer esos miedos
mediante una técnica de imitación social, en que un sujeto no temeroso manejaba
el animal en presencia del sujeto que sufría el miedo.

Al producir una fobia (miedo agudola los objetos peludos blancos en el pequeño
Albert mediante, el condicionamiento clásico, Watson y Rayner lograron demostrar
que también las leyes 'del aprendizaje pueden explicar por lo menos algunas formas
de conducta patológica.

Una razón por la cual Watson no fue el primero en emplear las técnicas que hoy
llamamos de modificación de conducta residió en que, en 1920, debió abandonar la
universidad como consecuencia de su episodio sentimental con su ayudante de labo-
ratorio, Rosalie Rayner. Puede que ese episodio lo haya perjudicado menos a él
que al campo de la psicología. Se divorció de su mujer, se casó con Rosalie,empezó
a trabajar para una agencia de publicidad (la J. Walter Thompson) y se hizo rico.
Publicó en 1924 ur. importante libro y dejó su propia marca en el público con el
lema "el verde del Lucky Strike· se fue a la guerra", relativo al c:unbio de color de
los paquetes de cigarrillos Lucky Strike, que de verdes pasaron a ser blancos con
el fm de economizar colorante verde a favor del esfuerzo bélico norteamerica·
no durante la Segunda Guerra Mundial (Schultz, 1969). Cabe suponer que ese
lema procuró aumentar la venta de esos cigarrillos ":1ediante un condicionamien-
te logrado por la contigüidad de su marca y las expresiones de patriotismo. Al
apartarse Watson de la psicología académica, la defensa de la tesis de la conti·
güidad en la teoría del aprendizaje cayó en las idóneas manos de Edwin Guthrie,
quien desarrolló su teoría con más detalle que Watson la suya y cuyas ideas influ·
yeron más que las de éste sobre el futuro de la teoría del aprendizaje.
r;"igura 2.1. Watson avanza furtivamen/e hacia el "pequeño Albert", quien, sin
sospechar nada, juega feliz con una rata blanca. Watson liene un martillo con el que
se dispone a golpet1T una barra de acerO colgante, "de 1,20 metros de largo y 6 milí- EDWIN R. GUTHRIE (1886-1959)
metros de diámetro", para iniciar asi el proceso de convenir al "pequeño Albert"
en el primer ser humano que cOlltrajo una neurosis experimental, bajo forma de un Formado primero en filosofía, Guthrie se convirtió en psicólogo al convenceISe
miedo fóbico a los objetos peludos blancos. La ayudante de Watson, RosaUe Ray- de que el método experimental podía ser empleado para abordar muchos de los pro-
/ler distrae al "pequeño Albert" mientras Walson se aproxima. blemas tradicionales relativos a la naturaleza del hombre. Bajo la fuerte influencia
de la teoría del filósofo Singer, según'la cual muchos de los problemas de la meDie
podían trasladane ala conducta (Guthrie, 1959). adoptó el conductismo. Su primer
Perspectiva
texto, de 1921. fue de tono en gran medida watSOIÚanO, La conducta simple era
cuestión de conexiones E- R simples, y la conducta compleja consistía en una
El caso del "pequeño Albert" le proporc!onó a WatsQIf un modelo de cómo se
multitud de conexiones E-R simples. Al igual que Watson, vio el cerebro como una
puede adquirir un miedo. Si bien sugirió un tratamiento pua eliminar el miedo, no
tabu/a rasa y restó importancia a los principiOS' de organización innata y motm-
tuvo oportunidad de aplicarlo. Quien lo hizo por primera vez fue Mary Cover Jones
X
,
4

-
/

. di
dl-' ...
d'
Teonas del

-
. -
aprendizai~
(, ,:) La escuela norteamericana de psicología -que ya estaba I'nteres'da
' I ' ,
compau,uvo e :1 pw;o ogla- enolo una dlSposicion a SOmeter las aC':"I'd'd s

I tIId'
en e es 10
'-"-
u, • e nervIosas supe-
nares e os anuna.e~ a ¡nallSlS expenmen13les bajo distintas condiciones especialm-e ntc ideadas,
Thorndike y Hull

psicólogos aplicados a la cuestión se retrajeron ya hacia la elaboración de modelos


limitados de tipos específicos de fenómenos de aprendizaje, ya hacia -el estricto
75

-.---
._-- ~

. .

BIen podemos. consIderar _el t~13d? de ~orn~iJ(e 1ñe Animal-lntelligence (1898) como el enfoque empírico de atenerse_ aJa~ relaciones E.::..R observables, tal como lo preco-
punto de partida pasa las InvestJgaclones slslematicas de este orden. (Pavloy. 1960, página 6.) ltizan los slcinnerianos. Aun así, la influencia de HuU siguió advirtiéndose en el tra~ -'---
bajo de sus muchos discípulos talentosos, que colectivamente han aportado las prin- . ----- --
Fue en gran medida con sus ataques contra Thomdike como los teóricos de la cipales alternativas conductistas del criterio skinneriano. Algunos, como Spenc~,
e .estall. ~ue. s~ han de cons~derar en el capítulo 5, llamaron la atención de la comu- siguieron una- linea paralela a la de Slcinner al aceptar la contigüidad como el meca-
OIdad pSlcologIca norteamencana. - nismo propio de los reforzadores del aprendizaje condicionado y el refuerzo cama
Thorndike logró ga~ar la aceptación de un enfoque mecanicista, de orientación el mecanismo correspondiente a las respuestas de aprendizaje manifiestas_ Otros,
experunental, del estudiO del aprendizaje, en reemplazo de un sistema mentalista como Miller, extendieron los supuestos sobre reducción del impulso formulados por.
(el empleo de ,.un~ sup~esta "mente" o supuestos hechos mentales para explicar HuU a nuevos campos (en el caso de Miller, a la imitación).
la conducta), ¡!1n mcurnr en los excesos de la teoria de Watson. Hizo del v' I
E R t -, .J 1- - - . I Incu o
- , a.n, es que¡'tlcpensamlent9, e ~entro del- aprendizaje. El trabajo inicial de
Thorn~lke e.n tomo d~ I~s .gát<:s. ~arco el cornienzo de una tradición norteamerica- EDWARD L THORNDIKE (1874'1949)
na de investigar los pnnclplo~ oaslcos del aprendizaje mediante el empleo de susti-
tutos ~nlmales para establecer hechos básicos qUe, a continuación, se suponían Antes de Thorndike, la mayoría de las concepciones acerca del comporta-
ext~nslbles a la conducta humana. Tanto Hull cama Skinner (considerados en el miento animal eran gobernadas por el supuesto de que los animales razonaban en
cap. tu lo 4) u tilizaron también ratas y palornas, poco menos que intercambiables forma muy parecida a como lo hacen los seres humanos, o bien por explicaciones
por sere~ humanos, ~ ~Iaborar sus principios. También conservaron la orientación basadas en mecanismos instintivos. Thomdike desdeñó abiertamente la posibilidad
conduct!sta y mecaOlclSta de la obra de Thorndike_ Sin embargo sus enfo -- d de otorgar a los animales característicJS humanas (proyecciones antropomórlicas)
la ~ l '' d ' b I ,ques e
ormu .aclon e teonas so re e aprendizaje iueron tan opuestos como odían y trató de explicar el aprendizaje animal como resultado de hechos ' y principios
haberlo Sido. p
simples. Al publicar su tesis de doctorado, que versó en torno de los métodos
'PuU.procuróelaborar teorias según la pauta de ~ ciencias físicas pero des ué - mediante ros cuales los gatos resuelven problemas de caja de truco (Thorndike,
de su muer tI "
e a mayopa de ositeoncos
' . norteamericanos del aprendizaje, empezaron
P s
1898; véase la figura 1), presentó pút'liicamente su sustituto mecanicista de la inte·
a abandonar esos esfuerzqs .. En los Estados Unidos la psicolog}'a e ' 1 Iigencia animal. Después de observar las pautas que seguían sus cinco felinos al
. . . fii! . fi -., mpezo por a teo-
nzaclo.n oso Ica deW~lli~m Jam.es, qu~en, maestro como fue de Thorndike, vio a aprender a escapar de cajJS de truco, Thorndike afirmó que el aprendizaje animal
su ~?tlgu.o alumno convertIr la pSlcologla en una ciencia caracterizada por la obser- es cuestión del "e~tampado" gradual de vínculos estímulo-respuesta mediante el
vaclon dlCecta ~e la conducta y for la experimentación (Hilgard y Bowler, 1975). _ ensayo y el error. Si Thomdike se hubiera limitado a proporcionar una teoria meca-
Hull.se propoOla ser un Newt~n de la teoria del aprend~aje y elaborar un sistema nicista del aprendizaje animal, su impacto habría sido menor. Pero no vio en sus
de cá1~ulo de la co~ducta med.lante la aplicación tanto de los principios de la ló ica observaciones nada que lo convenciera de que el aprendizaje humano difiriera en
formal como del meto do expenmental. g
algún sentido cualitativo del aprendizaje animal. Al ado ptar esta posición, Thorn-
No ob.stante much?s años de trabajo esforzado y minucioso, el esfuerzo de HuI! dike se opuso directamente a la docuina dualista según la cual el aprendizaje
y sus segUidores fracaso. Que HuU no acertara a forlIllllar acerca del d" humano involucra comprensión, o el acto de aprehender una "idea", en tanto que
' . - apren IzaJe una
leOrta tan. pre~lsa ~o~~ la ~e Newton sobre el movrmiento rio se debió a falta de los animales son como máquinas controladas por instintos. También se opuso a la
esfuerzo ni de IOsp~a~lOn, ni tampoco a que el proy~cto fuera en sí mismo descabe- doctrina de la razón animal (Bailes, 1975).
llado. ~_o que derroto a HuU fue más bien, como fa reveló su propio trabajo la Al adaptar al terreno del aprendizaje la concepción darWiniana de que hay con-
complejidad del proceso del aprendizaje. Considenda esa labor en retros ect: tinuidad entre animales y hombres, Thorndike introdujo en la psicología nortea-
una de las principales .c?ntribuciones de Hull tal vez Iiaya consistido en de~os:;:; mericana el supuesto conocido ahora como principio de equipotencilllidJUi. Este
que el contemdo .tematlco .que aborda el psicólogo del aprendizaje es, fundamental- concepto se basa en la creencia de que las leyes del aprendizaje son independientes
mente,. mucho mas complejO que los fenómenos invrstigados por Newton y la física de los tipos de estímulos usados, de las respuestas estudiadas y de las especies a las
de su tiempo.
que se aplican las leyes. Estos supuestos proporcionan la base teórica que justifica

.
Fracasados los esfuerzos hullianos por formulada uniteori; deJ"aprendizaje, los

Sir h:tllt: ",""tan (1642,1727, debe p3rtÍ<.."tIf:rññcÍltl:~U renomb' I (, _ _ . '


"' -\ II~a 01.: 'liS IcYl.-s sobre: la gravedad y cl _movillli.:ntu. rc a a onnuTaclon mate-
I
.1
!
el empleo de sujetos animales en el estudio de las leyes del aprendizaje. y Thorndike
fue el primero en usarlos con ese flfl. Los sujetos animales tienen las importantes
ventajas: de estar generalmente disponibles cuando se los necesita y de que no son

: Adviérta.'IC quc sólo \on venlaja~d~ el punlo de yisU cll:1 experimentador.


I
I
76 Teorr'as del aprendizaje - ' -~~ .. Thorndike y Hull 17

capaces de expresar sus objeciones ante los métodos de shock y privación de ali·
mento a que se los somete, Desde un punto de vista más decisivo, si el estudio de la . ~_ -:----L _ _. _

conducta de los animales puede informarnos sobre las leyes que gobiernan'el apren" -
dizaje humano, la conducta animal (y también la humana), que puede ser medida
más objetivamente que el pensamiento humano, se convierte en el contenido temáti-
co propio de la psicología. Con su deseo de extraer del estudio de gatos conclusio·
nes apücables al ser humano, Thorndike prefiguró las prácticas de los modernos
modificadores. conducta les (véanse los capítulos 6 y 10). .~

Thorndike pensó que el aprendizaje consiste habitualmente en una cuestión de


fortalecer automáticamente los vínculos E-R por efecto de una experiencia de
..
ensayo y error. S~puso. que las leyes que rigen ese aprendizaje son las mismas para
los animales y Icr r ·
,~

. :
se~~s humanos.
. ......

CómIJ·se produce el aprendizaje: primera (eoria de Thomdike

La teoría de Thomdike permaneció esencialmente intacta desde 1898 hasta


comienzos de la década 1930-40. El núcleo de su teoría consistía en tres leyes prin.
cipales. La primera es la ley del efecto, la cual sostiene que "aquellas respuestas
dadas inmediatamente antes de una. situación satisfactoria tienen mayor probabili-
¡,.
.j"'"""f
' ~JJv. I.,
·¡ro( I
/'
10 t::=:CI 1 t" ' " 11
dad de ser repetidas" (Thomdike, '1913, página 2). De aalerdo con este concept%~~
,

los animales tienden a y


mantener estados satisfactorios a no mantener los insa-
tisfactorios. En c'onsecuepéia;:a qespecho del tono subjetivo de los términos "moles-
tar" y "satisfacer", Thorridike los deflllió por la conducta del animal, sin recurrir Figura 3.1. Gato atónito en una de las ,cajas de truco ídeadas por Thomdike.
a conceptos mentalistas. Los factores de satisfacción "estampan" reseues~as y los Oprimir la palanca situada exactamente delante del gato fracciona la cadena que
de molestia las "borran" (Lefranc;:ois, 1972). Consideró que esos "estampados" abre la puerta, lo cual pennite al frusttado felino escapar.
eran directos, mecánicos y no implicaban conciencia o percepción del aprendizaje.
En conseGuencia, deflllió el aprendizaje en función de vínculos E-R que se "estam·
pan" gradualIDente en el cerebro. A continuación, los vínculos completos funcionan
en forma muy parecida a corno lo hacen las conexiones hereditarias (instintos y
reflejos). Esta deflllicion tiene considerable similitud con las especulaciones neuro-
lógicas de Pavlov. . fortalece y que su desuso las debilita. El principio del "uso" explica principalmente
La segunda ley de Thomdike es la ley de la predisposición, formulada en fun- actos repetitivos tales corno las destrezas motrices y la memorización de poemas. El
ción de unidades neurares hipotéticas. Esta ley sostiene que la satisfacción y la principio del "desuso" explica el olvid? en general Admitie~do q~~ I?s factores de
molestia dependen del estado del organismo en el momento en que actúa. Cuando contigüidad pueden influir sobre los VInculas E-R, Thorndike cntIco a la vez que
una unidad neurona! de conducción está predispuesta, la conducción es satisfacto· se empleara ese principio sin tener en cuen~ la. I~y del efecto (Hilgard. y Bower,
ria: cuando la unidad de conducción no le está, la conducción es molesta. Cuando la 1975). Thomdike reprobó la idea de que el eJCfClClo puede bastar por S1 solo para
unidad de conducción está dispuesta y no hay conducciÓlt, el organismo se siente
producir aprendizaje.
frustrado o molesto. En cierto sentido, esto se parece bastante a los principios de
expectativa aducidos pl)r los teóricos cognitivistas, que se consideran en el capi- Según la teoria de Thorndike, se produce aprendizaje cuando: 1) una respues.ta
tulo 5. conduce a la satisfacción o a la evita~ión de molestia (ley del efecto); 2) elorganls'
La tercera leyes la ley del ejercicio y representó una concesión a la teoria del mo está dispuesto a responder (ley de la predisposiciónl, Y 3) este aprendizaje es
aprendizaje por contigüidad. Thor'nd.ike sostuvo que ell3So de las conexiones las
afianzado por la práctica (ley del ejercicio).
78 Teorr'as del aprendizaje Thor"dike y Húll 79
. _~

Thomdike propusO además las cinco leyes menores siguientes: de 12 días de práctica_ Este autor, empero, utilizó el experimento como un ejerci-
cio en el comienzo de cursos sobre psicología experimental y comprobó que, si bien
1. Ley de Úl respultsra mú/riple: esta ley sostiene q~e c;-;ando una per~ona en situación de seguían-,obteniéndose los resultados básicos al<:anzados por Thorndike, la oportuni-
aprendizaje enfrenta un problema y la primera resPtlesta no produce un eslado de cosas dad de observar a un sujeto que recibe realimentación permite despuesar observ~­
satisfactorio, la persona intentará oUas respuestas. &tctrabajo a lo largo de unajenrquía
de soluciones constituye la escncia del aprendizaje P_ el ensayo y el error. El éxito, desde dar demostrar algún mejoramiento aun sin recibir realimentación. Desde luego,
luego, estampa la respuesta que lo alcanzó. Una perSOna que encuentra sobre su escritorio Thomdike explicaría este resultado como el ensayo implícito de aquella coneldón ·
Uaves ex traviadas, después de haberlas buscado por toda la caSa, volverá a buscadas allí conducente a una "reacción· de confumación" o satisfactoria (Hilgardy Bower,
cuando las pierda de nuevo. . . __
o .
1975). Debe quedar en claro que, a esa altura de las circunstancias, la perduración
Lq de la predisposición o acrirud: de acuerdo con 4a, el aprendizaje no existe indepen-
dientemente del organismo que actúa. Si una personaSe siente deprimida, puede que aban-
de la teoría de Thomdike se debía en parte a su flex.i~iJijad y su disp"osición a
done alguna t;uea sin encontrar solución. También se considera que la actitud consiste en tomar en préstamo conceptos de otras, lo cual evitó que los suyos propios enveje-
predisposiciones detcnninadas cultur.dmente a conducirse en fonnas espec~{jcas_ Si el . cieran prematuramente.
grupo de referencia cultural de una persona le ha enseñado que la mejor reaccion ante una Otra modificación de la teoría inicial consi~tió en rebajar el papel del castigo
situaciónjiustí'ante es la indiferencia e~toica,al scotÍlse frustrada esa persona reaccionará como debilitante directo de vínculos cuyo poder era igual al de la recompensa,- al
en fonni mUJ distinU a como lo hara aquella cUY1Jgrupo enseñe a responder agresiva-
mente a las (iustr:lciones. ,~ -, . papel de influencia indirecta capaz de inducir a un animal a modificar sus respuestas
3. Ley dlt la prltpotencÍ4 de lo~ clementos: designa la eapacidad demostrada por el sujeto al verse frente a una molestia. Thomdike obtuvo en biografías evidencias de distin-
que aprende para responde! só[o a los aspectos implllrtantes de una situación. Tiene pare- tos tipos, incluso testimoniales, acerca de la eficacia relativa de la recompensa y el
cido con el moderno análisis ruso (véase el eapítut. 8) del segundo sistema de sedales, I:astigo (Hilgard y Bower, 1975). Como se verá. esta disminución del acento puesto
corno medio con que un hombre puede avisarse a sí mismo que restrinja su atención a lo sobre el castigo en el aprendizaje es sirrúlar al pequeño papel que Skinner asigna al
que p¡obablemente sea lo más importante ~ar~ 13 ;il:Solución de un problema. También
posee similitud con las ellpecutivas que se considcan en el capítulo 7 en relación con
castigo. La versión revisada de la ley del efecto de Thorndike, que disminuyó la
las teorias cognitivas del aprendizaje:. , importancia de las molesti~s, se denomina ley del efecto truncada.
4. Ley de Úl rerpueIta por analogia: se refiere a la capaidad para reaccionar ante una situa-
ción nueva median te respuestas aprendidas en una _ación conocida. Esto sugiere que es Thorndike tenía conciencia de los ataques que los teóricos de la Gestalt lanza-
posible transferisrespuestas de una situa.ejón a oU-a.1horndike dice también que el grado
, de uansferencia 'es una función de la similitud en~ ambas situaciones (en Lefnn~ois,
ban contra sus teorías. Como concesión a los resultados obtenidos por esos investi-
'¡ 9'{2). Ejempl"1 de eUo podría seda transfer~nciade~s destrezas para mantcncs el eQuili- gadores, agregó a su propia teoría un principio organizativo (en HiIl, J971). Este
brio y ¡ceionar el planubrio cUiUldo de manejar una'icicleta se pasa a manejar Una moto- principio de pertenencia sostiene que se puede establecer más fácilmente una
cicleta. Este concepto', tiene aflSlidad con el de genCllllización de tácticas de respuesta, o conexlOn en e aOSuñiaades o ideas cuando se las advierte en relación de pertenen-
esuategias de reSpuestL " . ' cia mutua_ En el campo del aprendizaje humano, se utilizó este principio para expli-
5. Ley del cambio asociativo: esta ley se refiere a una trlItsferencia de control de estímulo de
, una señal il otra. Como tal, presenta mucha analogÍacon el condicionamiento clásico. La car el nexo más estrecho entre las ideas "Carlos" y "estudiante" que entre las ideas
primera seilal es análoga al El Y la segunda lo es al EC-Emperó, la capacidad de la primera "estudiante" e "iniciarse" en la oración: '~Carlos es un ansioso pero poco experi-
señal para controlar la respuesta es transferida a la'seJlllda !eñal por efecto de la alteración mentado estudiante, que se inicia en psicología". Esto sucede así a pesar de que, en
$Íadual de la 9 rime~ señal hasta que se co~vierte erma: segunda. Thorndilce sostuvo que el el tiempo y en el espacio, "se inicia" está más cerca que "Carlos" de "estudiante".
condicionamiento clasico es un caso especIal de cllllfrio asociativo (en Hilgard y Bower,
'1975). Un procedimiento de este tipo se empleal'n producir aprendizaje sin errores
Thomdike también utilizó el principio de pertenencia para explicar las percepciones
mediante el cambio de control de señal de una dimQlión de señal fácil a oua más difícil del sujeto acerca de las contingencias relativas a la recompensa y el castigo. Si una
en el capitulo 9 se considera el aprendizaje sin error~por debilitamiento). estúdiante estima que una nota baja se debe a su personalidad y no a su aplicación
al trabajo, la contingencia no "pertenecerá" al trabajo y su conducta de trabajo no
se modificará. Las feministas ardientes, al observar que en la frase anterior se habla
Cómo se produce el aprendizaie: revisiones pc;steri,-s de Thorndike deliberadamente de "una" estudiante, pueden considerar ese artículo "pertenecien-
te" a la mención de un fracaso y, en consecuencia, experimentar la oración como una
Después de 1931 Thomdike introdujoen:.a teoría varias modific:aciones molestia_ Otras personas. que no vean una relación entre "su" y "nota baja", no
importantes. La primera consistió en repudiar la ~del ejercicio. Thomdike nunca experimentarán reacción emocional alguna_
se había sentido cóm"do con la idea de que' la prádCa bastara para reforzar las ten- Thomdike aportó una tercera mOdificaci?n que constituyó un desafío directo
dencias a la respuesta. En 1932. Trowbridge y Cas~informaron acerca de una serie al ,punto de vista guestáltico de considerar las relaciones estimulo-respuesta como
de esrudios., efecruados por Thomdike, seg1Ín los :atales la meia práctica no habría totalidades. Esa modificación consistió en aflITllar que las aciones E-R son ,P12l~
logrado producir aprendiZaje. En esos estudios, se3itpuso a los sujetos la tarea de rizadas o unidimensionales_ De acuerdo con este principio, si alguien aprende a
dibujar a ciegas una línea de 10 cm con y sin realÍlentación en cuanto a su exacti-
tud. Sin realimentación no hubo mejoramiento al~o de la exactitud, aun al cabo , traducir del japonés al inglés, no por ello será G.apaz de traducir del inglés al japonés
con l. mlm>' d_",. ' . ~

I
. . ¡ .

r· "
l~ Teorzas del aprendiza;e ~._. Skinner: refuerzo o comiicionamíeniljopeiiinte 105

/Este
¡ ~rincipiOfundamental de "caja negra" u "or~anismo vacío" co~o ~unto medio por el cual nuevos estímulos pueden llegar a suscitar estados emocionales o
de partida para -el -estudio de la conducta se opone dlCec~mente ._aJa.practlca de motivacionales: Este concepto··se incorporó a su tepría como base que explica eL_·_
especular acerca de construcciones hipotéticas o vuiables intervinientes que actUan poder del refuerzo secundario o condicionado. Su empleo de los principios de
en los organismos. Una de las razones fundamentales por las que Skinner decidió asociación para explicar el refuerzo secundario es muy similar al enfoque adopta4o
centrarse en los hechos ambientales antes que en los internos reside en la riqueza de .. por Spence y convierte la teoría de Skinner sobre el aprendizaje en una teoría de
información qúe puede obtenerse así para el análisis científico de los factores que dos factores_ No obstante su renuencia a postular hechos intemosño observables
determinan la conducta. La información de ese tipo incluye tanto variables presen-' . como factores causantes de la conducta, Skjnner explicaJa. acción del refuerzo
tes en el ámbito que rodea inmediatamente :U organismo com~~j~bles relaciona-o demorado. o del comr!etamiento de largas cadenas dcrespuesta en función de
das con la historia del organismo. Sklnner consideró que las variables independien- respuestas internas que conducen hacia una meta y generan estímulos que quedan
dientes de ese orden podían investigarse mediante los instrumentos habituales de la clásicamente condicionados a refuerzos primarios. A juicio de los seres humanos,
ciencia. Admitióque esas variables pueden influir en formas sutiles sobre el compor- esas señales y respuestas internas "constituyen determinadas consecuencias verbales
tamiento, pero,.,considcró que no es posible explicar en forma acertada la conducta proporcionadas por el hombre mismo( .. ,)" (Skinner. 1953, página 77). Denominó
sin investig:lCla's. ~. propuso ;laborar un. mét.~do dean.ál~~s de la función que los "refuerzos generalizados" a los refuerzos condicionados apareados a más de un
t:
. hechos ambientales cumplen en determlnaclon '1 predlcclon de la conducta de los refuerzo primario y los consideró más poderosos que cualquier refuerzo condicio-
organismos. nado vinculado con un solo tipo de estado de privación_
El método empleado por Skinner para investigar las variables externas que
controlan la conducta consiste en lo qué él denominó un análisis causal o funcional. (.. ,) si un refuerzo condicionado ha sido apareado con refuerzos apropiados para muchas
A su juicio, las variables dependientes son los efectos de las variables externas, P los condiciones, es probable que por lo menos un estado de privación apropiado prc:valezca en una
cambios de conducta suscitados por éstas. La meta que se propuso alcanzar median- ocasión ulterior. En consecuencia, es más probable que se: preseate una respuesta.. Cuando refor-
te este método de análisis fue la predicción y el control de las variables dependientes zamos con dinero, par ejemplo, nuestro control posterior eúelativamente independiente de las
privaciones momentáneas. (.. .) Somos reforzados automáticamente, al margen de cualquier
(conductales). A juicio de Skinner, las leyes de la conducta consisten en las relacio- privadón particular, cuando logramos controlar con éxito el mundo físico. Esto puede explicar
nes causa-v-efecto entre las variables independientes (hechos ambientales externos) nuestra tendencia a empeñamos en artesanías que exigen destreza. en la creación artística y en
y las ' v'ariables de respuesta (dependientes). Consideró que una síntesis de esas leyes deportes tales como los bulos, el billar y el tenis. (Ski.,ner, 1953, páginá 77.)
en términ~s cuantita'tivps proporciona una imagen amptia de los organismos como
sistemas de conducta_ ' Est~ e,nfoque adoptado para la formulación de una teoría En consecuencia, Skinner recurre a un p~ncipio de contigüidad para ofrecer
era muy. distinto del ·éiue~ preflrieron Hull y otros, a cuyo juicio la causación incluía una explicación convincente de aquellas conductas que parecen carecer de relación
las variables mediadoras inte·m as que suponían existentes dentro de los organismos. con el refuerzo inmediato. . .
Skinner no necesitó apelar a variables tales como el impulso y la motivación incen- Skinner considera que las respuestas condicionadasélásicamente son suscita-
tiva, porque estimó que especular acerca de ellas era simplemente innecesario para das en forma automática por señales automáticas. Por,lo tanto. también rotuló
una cie·ncia cuyas metas consistieran en predecir y controlar la conducta. como respondiente, o condicionamiento de tipo E( tipo estímulo), este tipo de condi-
cionamiento. De acuerdo con Skinner, "las respuestas y actitudes provocad:1s por
Cómo enfoca Skinnú la cuestión contigziidad/refuerzo lindas niñas, bebés y escenas agradables pueden transferirse :1 marcas comerciales,
productos. imágenes de productos, y así sucesivamente" (1953, página 57), (Aquí
Si bien Skinner adoptó una actitud radical en la búsqueda de la causación en el yace la explicación del éxito publicitario alcanzado por John Watson con su lema
ambiente, asumió una posición flexible en lo que se refiere a los "cómos" del "el verde del Lucky Strike se fue a la guerra",)
aprendizaje. Estaba muy familiarizado con las indagaciones de Pavlov y los prin- A la vez que tributa el debido respeto a la metodología y los principios de
o cipios del condicionamiento clásico. En vez de; rechazar un mecanismo de contigüi- Pavlov, Skinner considera que el condicionamiento respondiente o de tipo E ofrece
dad del tipo descripto por el investigador ruso, postuló la existencia de dos tipos limitado interés. Lo que más lo preocupa es la conducta manifiesta que tiene conse-
distintos de aprendizaje_ En el primero, o tipo pavloviano, un estímulo antes cuencias sobre el mundo circundante. En la conducta de ese tipo, sus consecuencias
'neutral adquiere el poder de suscitar una respuesta que originariamente era causada se "realimentan" al organismo y pueden modificar la probabilidad de que se repita
por otro estímulo. El cambio se produce cuando el estímulo neutral es seguido o la conducta que dio origen a esas consecuencias. Cuando una consecuencia actúa
"reforzado" por el El. Skinner considera que este tipo de condicionamiento es de' manera que aumenta la probabilidad de recurrencia de una respuesta, se dice
importante para la modificación de las respuestas primitivas de carácter visceral (del que obra como un reforzador y que el acto de manifestar esa consecuencia es un
tubo digestivo) y otras de los músculos lisus y las glándulas. Por ser estos sistemas ·refueno, Según la teoría de Skinner. un reforzador es todo aquello que aumente la
de respuesta primitivos tan importantes para la emoción y la motivación, Skinner probabilidad de re-ocurrencia de una respuesta; su defmición se formula exclusiva·
considera que el condicionamiento de este tipo (condicionamiento clásico) es el mente en ténninos de operaci~nes conductales y no supone factores internos tales

I
106 Teorras del aprendizaje Skinner: r~fueT%o o'condicionamiento ojiira;¡i-e":"
107
como el impulso o la motivación. El condicionamiento de este orden se denomina espontánéamente. En .el condicionamiento
. --- de tipo R. el ·cual Sk'Inner concentro~- -
(en.
condicionamiento operante, porque el organismo operaen, su__~biente,-o.-condi­ sus esfuerzos)

los estimulas
..
pueden _ actuar como estímulos discrl'm-lOa t'IVOS lE OS )
cionamiento instnmlental, porque las respuestas desempellan una función.instiU-- --- que dicen al organismo dónde y cuándo debe esperar un refuerzo. •
mental en la determinación de una consecuencia. El condicionamiento operante
difi~r_e del condicionamiento respondiente (clásico) en que no se considera que la - Skinner y la generalizabilidad de las leyes del aprendizaje
mayoría de las respuestas sean provocadas por estímulos. Desde el punto de vista de -
Skinner, es simplemente imposible observar, en la mayoría de los casos, que un Si bien no niega la posibilidad de que factores hereditarios plledan influir sobre
supuesto "estímulo" haya tenido el carácter operante que sele atribl!y~~n co~~­ las respuestas .d~ los organismos. hasta el ~unto de revelar entreJas especies rasgos
cuencia, se considera que la conducta operante es emitida espontáneamente por el de conducta tlplcOS de eUas, Skmner sostIene que, en el marco dellaboratorio esas
organismo que sigue talo cual conducta. Este enfoque evita la tentación de identifi- dife~ncias específicas se reducen al mínimo. Si el organismo responde al estí~ulo
car qué hechoqmeden obrar como estímulos ambiguos. Recuérdenselas dificulta- . proVISto, de mo~o que .accione fácilmente el aparato experimental, y sj los reforza-
des, considerad"as (Irt el capítulo I~ con que tropezó Pavlov al crear condíciones de dores cumplen en verdad su función de reforzar:
investigación quelle pennitieran coqfiar razonablemente en cuáles eran o no los
"verdaderos" ECs y Els. ·..' - --- - . En ese. c:uo, los datos revelan una u_nir~.rmid~d e.xt~30r~.in3Cia en un3 :lmpli3 g:¡ma de: espe-
Sin embargo, una respuesta operante puede, y a menudo así acontece, contraer cies. Por_ ejemplo. los pro~os de exhn':lon, dlSCnmIR3CIOn y lener:llizacion. :ui como lo~
desempenos causados por dIversos progr:un:u de refuer7.o. son rccon(orbntcmc:nto: similares
una relación con un estímulo particular, y esta Qcurrencia puede incluso ser contro- _(Sldnner, 1969, página 190.) .
lada en parte por ese estímulo. En esos casos se 1.0 denomina estimulo discriminad-
va fED o E+); este estímulo sirve para señalar al organismo cvándo es muy proba- En otras palabras, las leyes del aprendizaje descubiertas en el ambiente controlado
ble el refuerzo para emitir una operante específica. Puesto que el En es ahora del laboratorio son generalizables de ras palomas y las ratas a los hombres. Con
la señal para que se presente la conducta operante, se dice que la respuesta operante vistas a crear ese ambiente controlado de laboratorio, Skinner inventó ese utilísimo
es una operante discriminada. Empero, el estímulo no suscita la aparición de la instrumento de investigación sobre animales llamado caia de Skinner l•
respuesta, como en el caso de un reflejo pavloviano. Los Eos sirven para guiar la
::onducta;- y en un apartado posterior se examinará con más detalle la cuestión de La caja de Skinner
los programas de razón fija y las cadenas de r~spuesta. También constituyen la base
del aprendizaje disciiini~.at~vO en aqueUos casos en que se combinan con estímulos Tal como Pavlov, Skinner aponó no sólo una teoría sino también una metodo-
(E-o EA) que señalen que la emisión de una operante tiene . escasas proba- logía. La caja de Skinner es relativamente económica y de fácil empleo. y aquí se
bilidades de ser reforzada: Esas funciones de señal Ea se desarrollan a partir de una ha de considerar con cierto detalle su funcionamiento. La caja de Skinner evolucio-
historia anterior de carencia de refuefZo en presencia de esos estímulos. La fuerza nó gradualmente, a medida que los supuestos de Skinner sobre la conducta se modi-
de la pperante es indcpendiente de esos estímulos excita torios o inhibitorios. O ficaron, y los tipos de datos obtenidos de la caja influyeron a su vez sobre el tipo de
sea, el estímulo discriminativo se limita a avisar al organismo cuándo debe emitir teoría emitida por Skinnc:r. Su metodología ·se basa en el supuesto de que el princi-
la operante. pio de equipotencialidad es habitualmente válido en el marco controlado que ufrece
El énfasis puesto sobre las respuestas determinó que el condicionamiento el laboratorio. Por lo tanto, si en esas condiciones las leyes que gobiernan las
operante fuese denominado condicionamiento de tipo R (respuesta). La "R" puede respuestas elegidas son las mismas leyes en cualquiera de las especies superiores, la
también ser recordada en virtud de su· asociación con el acento que Skinner pone respuesta que se elija para su estudio debe ser tan simple como resulte posible,
sobre el refuerzo. Ese acento sobre los episodios "R" es coherente con la distinción repetible a voluntad y en forma rápida, y faci! de observar y de registr;)r. · ,
que Skinner formula entre el refuerzo según la teoria de Pavlov y según su propia Cualquier movimiento particular de un organismo constituye una respuesta.
teoría. Una clase de movÍIIÚento o un tipo de conducta especifica que se ajusta a ese crite.
rio (como el de oprimir una barra o una paleta en una caja de Skinner con fuerza
_sufiCiente para accL0 ,!a} ~ n_microinterruptor eléctrico) se denómina una operante.
El propio P3vlov Uamó "refuerzos" a todos los hechos que fortaJec:ían una conducta, y
"condicionamiento" a los cambios resultantes. En el e:<perúnento pavloviouJo, empero. un refor- La frecuencia y la pauta con que se presentan las ope~tes son medidas. Otras
zador es apareado con un ~:rímulo: en cambio, en la conducta operante depende de una ru· variables dependientes posibles, como la intensidad o la duración de la respuesta, no
pu~ta. (Skinner. 19S3. página 65.) son medidas. La caja de Skinner proporciona un ambiente en el que el sujeto puede

Skinne!' reconoció la importancia tanto del condicionamiento pavloviano (respon' I La expresión "caja de Sl:.inner" no fue inventada por Skinncr. 'luien. según lIarris !
·diente, o de tipo El, en que el estimulo suscita respuestas. como del condiciona- , (1911). la aborrea:. Otra (pero embanzOSl) denominación podría ser 13 de -c;amarJ de ensayo 1
miento de tipo R (operante o instrumental), en que las r~eStas son emitidas operante". ¡
f
\
. -
Teodas del aprendizaje Skinner: refuerzo o condjcionamiento operante -' ~~- , - 109--
_iQ8
emitir una_respuesta susceptible de ser medida como operante estandarizado_ .ha verificado que controla con e ficacia la conducta de organismos similares sujetos
Skinner desarrolló gran parte de su teoría utilizando c~~~ datos las tasas según las a condiciones de .privación similares. En consecuencia, disminuye considerablemen. .
cuales las palomas utili~das picoteaban las llaves de estímulo (paletas) y 1ns ratas te la posibilidad de reforzar una conducta que . no sea la ·operante~_ f.oLlQ tanto, la
·· --opnmían palancas. Se debe tener en cuenta que sólo se consideran"operantes aque- caja de Skinner aporta datos precisos acerca de las relaciones entre la historia del -
llas conductas suficientemente vigorosas como para cerrar los contactos de los organismo (adiestramiento anterior y niveles de privación) y el control ejercido por
- microinterrup-tores (lo cual permite la acti.vación eléctrica de dispositivos que entre- el reforzador sobre las tasas de acuerdo con las cuales se emite la operante. y logr~ ­
gan refuerzos y/o cuent:1O las respuestas). Al contar sólo las operantes, la caj~ de todo esto sin necesidad de apelar a consideraciones sobre estados internos. En la
. Skinner elimina los juicios subjetivos del observador acerca de lo que debe conslde- c-,-,---,--- figura I se presenta un bosquejo de una caja de Skinner y el aparato registrador de
ra-rse- respuesta. La caja de Skinner no .sólo proporciona un ambiente en que ~e _ _ _ datos o re~trador acumulativo.
emite una conducta simple, producida libremente y medida objetivamente; a"demas El agreg~do del registrador acumulativo a la caja de Skinner supone el logro de
aporta un medio que permite controlar con precisión las consecuencias de las ope- una poderosa combinación. Al marcar la ocurrencia de hechos ambientales, sus efec·
r:mtes. Las conexiones eléctricas de la caja están dispuestas en fonna tal que el tos pueden leerse directamente en el registro de tasas de emisión de respuestas
cierre de los conti-~tos del microínterruptoracciona automáticamente un disposi- operantes. Como uno de los motores mueve la pluma horizontalmente en runción
tivo que entrega una .l~ntidad, mj:~id3 con exactitud, de una sustancia de la que se del tiempo y el motor de acción escalonada o solell_oide mueve la pluma-hacia arrib~
por efecto de cada operante emi tida, sólo pueden' obtenerse registros acumulativos.
Mkrointerruptor Paleta Esto difiere de una gráfica común de respue~tas en función del tiempo, en que los
Dirección en que se mueve puntos más bajos indican las declinaciones d_1! las tasas de respuesta. Casi todas las
el registrador en el curso gráficas reproducidas en publicaciones de orientación skinneriana consisten en regis-
.." del tiempo tros acumulativos. (Estos ofrecen la ventaja adicional de que el autor puede utili-
Duecclon en que
se mueve la pluma ;¡I ) ., _ zar el registro confeccionado por el registrador acumulativo para presentar los da-
registrar rcspueslaS .l?ISPO.SIUVO de tos, en vez de dibujar una gráfica, lo cual representa nada menos que un refuerzo
\
-
..acclon esc:uonada
para esos autores.)

Principios fundamentales

Trabajando con estos instrumentos relativamente simples pero precisos, Ski-


nner...elaboró cierto número de leyes sumamente eficaces para predecir y controlar
una amplia gama de conductas de varios orgaIlisrnos, entre ellos los humanos.: .

/ 'J ~ Sistem;¡· de Moldeamiento. Skinner sostiene que "el condicionamiento operante moldea
~¡--:--:--_...:v '/ en treg;¡ de Caía de Skinner para alle
la conducta tal como un escultor moldea un trozo de arcilla".
Al microintcrruptor grano
Registrador acumuúztillo
Si bien. en algún punto, el escultor parece haber producido un objeto totalmcnte nucvo,
siempre podemos seguir el proceso de vuc1u al trozo indiferenciado original. y podemos rcdudr
Figura 4.1. Cámara de ensayo operante de tipo Skinner para palomas. La a dimensiones tan pequeñas como lo deseemos las sucesivas e tapas a lo largo de 135 L-u~les
paleta o interruptor de p,coteo se llama opcranuum. )' «zs
operantes del organismo retomamos a ese esudo. (Skinner, 1953. página 91.)
consisten en su accionamiento. LaS seiiales luminosas que advierten a la paloma que
el picoteo será seguido por un refuerzo se llaman discriminanda El dispositivo regis- Si un refuerzo sólo consiste en algo que aumenta la probabilidad de ocurrencia
trador acumulativo agrega una respuesta tras otra como función del tiempo. Las de un operante dado, no parecería haber ninguna manera evidente de que se agrega-
tasas. de respuesta ba¡as producen líneas casi J/Orcontales: ell cambio, las tasas de ran respuestas totalmente nuevas al repertorio de operantes del organismo. Skinner
respuesta altas productll líneas muy empinadas. puesto que cada respuesta mu~~e elude este problema defUliendo al operante como una clase de movimientos. En el
la pluma en dirección verticaL A {gzmos regisiradores acumulativos marcan lamb~en proceso de moldeamiento. sólo se refuerzan aquellos movimientos cuya dirección
refuenos. (Desde el punto eJe vista técnico, lo que (lace el registrador acumulatlVo coincide con la nueva respuesta que se desea. Cuando la topología de la respuesta
consiste en sumar operantes. Todas «zs
opera/ltes son respuestas. pero no rodas las t las características físicas de la respuesta) cambia de modo tal que la mayoría de los
respuestas son operanres.. Sin embargo. la mayoría de los autores eln,!lean esoS movimientos son del tipo de lo que antes era la respuesta máxima, se selecciona
términos de manera intercambiable en tre Ú. por razolles de comodidad. Esa renden- para que sea reforzada una nueva respuesta máxima que coincida con la direa:ión ~
cifl vale t~mbién para este autor.) deseada. Este proceso de aprOximación sucesiva continúa hasta que el organismo ~
"- ,- - -

j~ Sli~J.f';'fumO o;ond~,on.~1K,.j2L;" :: SI ~.¡¡~¡


emi te la nueva respuesta que se deseaba. Incluso respuestas que quienes no tienen contingencias. Puede presentarse cualqlJiera de esas clases de refuerzo. lo cual es
experiencia en aprendizaje animal consideran a menudo innatas, como ~L~~to ~e contingente de la emisión de una operante, o bien puede ser eliminado, lo cual es
una rata al oprimir una'barra, habitualmente deben ser moldeadas. Ese 'proceso "- - contingente de la emisión de una operante especifica. Ambos pueden presentarse
empieza cuando se refuerza la rala a meter la cabeza en.1a tolva' que contiene el también sin relación con las respuestas de un organismo, lo cual constituye la quinta '
alimento, para lo cual el experimentador acciona manualme.nte el dispositivo que contingencía. En el cuadro 1 se exponen las cinco combinaciones distintas de tipos '
hace caer peUas de alimento cada vez que la c:lbeza de la rala se acerca a la tolva. de refuerzo y contingencias de presentación/eliminación. .- ,
Además, esto condiciona ' clásicamente el El del aümento al EC de los sonidos del
-- funcionamiento de aquel mecanismo. Cuando la tasa de emisión de esta operante Cuadro l. Reforzadores, contingencias y paradigntllS experimentales
, "cabeza de la tolva" Uega a ser lita, sólo se refuerzan los movimientosde·la·c..-,beza
en dirección a la barra. Cuando la rata se mueve hacia la barra en forma regular, sólo
se reiuerzan los actos de tocar la barra. Finalmente, sólo se refuerza la operante Contingen.cia
deseada, es decir, ;.el acto de oprimir la barra con fuerza suficiente para cerrar el
microinterruptorfy accionar automáticamente el mecanismo de entrega del alimen· Tipo de Reforzador Reforzador Reforzador
to o El autor de este Jfbro haaplicado 'más de tres horas a la tarea de moldear en ratas Reforzador presentado suprimido 110cOllril/gcllCc
particularmente lentas este pequdig fragmento de conducta. Esa experiencia contri· de respuestas
buyó a moldear su propia conductáen el sentido de emplear mayor privación y
técnicas de moldeamiento más eficaces. iPero (la aumentó su emisión de respuestas
en el sentido de que buscara cada vez más ratas para.moldearlas! Reforza· Refuerzo positivo {au· Castigo o extinción Condic:iol/amienw su·
dor posi· mento de las tasas (disminució" de las persticioso (aumento
Generalización. El moldeamiento se funda en la tendencia del organismo a no tivo de respuesta) tasas de respuesta) de las tasas de res·
dar exactamente en cada oportunidad la misma respuesta yana emitir sólo las puesta)
respuestas dadas precisamente a continuación de un refuerzo. Esa tendencia a emitir
una "farrUlia" de respuestas similares ejemplifica el principio de la generalización de Estímulo Castigo (disrnillución Refuerzo negativo Condiciollamiel/to SI/'
la respuesta .. A su vez,. se denomina generalización del estímulo a la correspondiente adverso de /as (asas de res· (aumento de /as persticioso (las tasas
tendencia de los estímulos ,similares al estimulo discrirninativo original a influir puesta) tasas de respuesta) de respuesta pueden
sobre la tendencia del organ~m? a responder similannente. El análisis skinneriano aumentar o disminuir)
de la generalización se pare'Ce a los formulados por Pavlov y Hull. Reconoce la exis·
tencia tanto de la generaüzación primaria como la secundaria, o mediada (como la , '
Este cuadro muestra las combinal.;ones de dos clases de refuenos y tres contingencias asociadas
verbal), y considera que la genenlización es la base de,la transferencia de aprendi- ¡ con el nombre técnico de cada combinación. . •
zaje de una situación a una situación nueva. I
I' El cuadro I muestra varias cosas. Una consiste en que el refuerzo negativo no
Un concepto clave del sistema de Skinner es el de moldeamiento, o método de 1 es lo mismo que el castigo. El refuerzo negativo es el que se recibe cuando se emiten
aproximación sucesiva, que supone respuestas de refuerzo que coinciden en la direc·
ción de la respuesta deseada final. El moldeamiento depende de la generalización
.
1
l
respuestas que ponen fma hechos desagradables. Ejemplo de ello podría ser el caso
de un hombre que, al Uamar por teléfono a su novia, es atendido por una voz
de la respuesta, o tendencia de las respuestas a variar de un ensayo a otro. mascuüna. Si pone fm al estímulo inesperado y adverso, consistente en esa voz
! masculina, colgando el tubo, la sensación de alivio experimentada ante la cesación
de esa voz aumentará las probabilidades de que emita respuestas de "colgar el tubo"
Cinco contingencias fáciles. Los reforzadores pueden dividirse en dos clases.
Una consiste en aquellos hechos que los organismos procuran experimentar de
, \ si se repiten esas circunstancias. Otro ejemplo consistiría (en Estados Unidos) en
verse obligado a asistir a una escuela donde se ensei'an las nounas de tránsito para
nuevo (sin excfuir la posibilidad de que un suceso particular pueda afectar en borrar del propio prontuario automovilístico el antecedente de una multa pagada
fonnas distintas a organismos diferentes) y se los denomina reforzadores positivos. por exceso ue velocidad. Se pueden emitir muchas conductas para librarse del
'La otra clase consiste en aqueDos hechos que tratamos de evitar y se Daman estímu- estímulo adverso que supone esa multa. El castigo, en cambio, supone "ser golpea·
los adversos. En el cuadro 1 se advierte que las circunstancias o reglas pueden dispo- do" por una consecuencia adversa (o ser despojado de un reforzador positivo)
nerse de manera tal que cada tipo de reforzador pueda asociarse, sea con un cuando se emite una conducta eSIJecífica, y ese hecho constituye una experiencia
aumento o conuna disminucíón de la probabilidad de una particular emisión de desagradable. Ejemplo de castigo es la presentación de una boleta de multa por un
respuesta. Las reglas que gobiernan la relación entre respuestas y refuerzo se Daman policía, hecho contingente de la conducta automovilística, o ser condenado a
!

. .. ; ; T~on"as dd apr~ndizai~ Slt.o J~r: refuerzo o.condicionami~nto operante°---~ 113


concurrir a una escuela de conductores. Los efectos del castigo son sumamente condicionamiento supersticioso podría ser el del jugador que ha llevado un amuleto
variables y dependen de la intensidad del estímulo adverso y de la propia historiaode -una pata de conejo, digamos- al hipódr0!!.10 el día en que gana la principal __ .. o
exposición a esos estímulos adversos1o En el capítulo 9 seex~na con 'mayor-
detalle el tema del castigo. En general, Skinner (1953) se opone al empleo de llevando el amuleto al hipódromo. 0----
apuesta. Esto aumenta esp~~taculannente la probabilidad de que en lo futurosiga _ _
--_o o 0____
OO

contingencias de castigo por entender que son ineficaces y tienden a provocar efec- la extinción del condicionamiento operante consiste en aquella situación en
tos secundarios indeseables, como el de inhibir las conductas deseadas. que la contingencia original entre una respuesta y un reforzador toca a su fm. En
Otra relación que se presenta en el cuadro 1 es la siguiente: aquellos reforzado- consecuencia, la respuesta ya no sobreviene en presencia del reforzador. Si bien los
res que no son presentados en nexo de contingencia con la ocurrencia de una efe~tos e~cíficos de este proceso dependen del programa original de presentación
respuesta particular pueden sin embargo llegar a controlar la conducta_ Skinner del reforzador, el efecto general consiste en un -aumento inicial de la fuerza y la
(1953)0(jamÓ a este efecto condicionamiento supersticioso y sugirió que muchas variabilidad de las respuestas en curso de extinción. La mayoría de los seres huma-
conductas humanas que parecen irracionales pueden haber sido condicionadas por nos denotan este efecto cuando una máquina accionada por monedas se rehusa
ese proceso. Se debe recordar que si bien los reforzadores pueden no ser contingen- o obstinadamente a reforzar la operante de depositar monedas en ella. Una persona
tes desde el punto de vista de un observador externo, el organismo respondiente que acaba de fracasar,'en una relación de amor puede insistir con mayor vigor e
ignora esa cirCl/hstaJ1cia. Si se efl1ite una conducta inmediatamente antes de la ingenio en sus tentativas por obtener reforzadores personales de su amor perdido
recepción de un reforzador. e~ coriducta es seguida por el reforzador y tiene más antes de tesar en esas respuestas. o
probabilidades de repetirse. De táaas más altas de emisión do: cualquier respuesta se
derivan más apareanúentos coincidentes con el reforzador. Así se pone en marcha Programas de refuerzo: el aporte rruis importante de Skinner
un ciclo y la conducta puede lIegat a ser muy frecuente. En los primeros estudios
que Skinner (1948) efectuó acerca de estos fenóme.nos, se presentaron reforzadores Skinner consagró la mayor parte de sus esfuerzos experimentales a investigar y
a palomas, a intervalos especificos, durante varias largas sesiones experimentales. describir con detalle los efectos que tiene el aporte de reforzadores positivos. Este
Si bien el refuerzo no era contingente °de ninguna respuesta particular, de las coin- procedimiento, desde luego, se llama refuerzo positivo y se parece mucho a la
cidencias iniciales entre conductas particulares y refuerzos resultaba que las palomas concepción popular del otorganúento de reCompensas. En tanto que HuU y Spence
quedaban finalmente "atrapadas" en la emisión de cadenas rituales y estereotipadas se centraron en los efectos que provoca modificar la cantidad (K) de refuerzo posi-
de respl.1estas emitidas en altas tasas. Entre eUas figuraban conductas tales como la tivo, Skinner se dedicó a trabajar en torno de la forma (llamada programa de refuer-
de saltar" ap<lyándose~ternativarnente en una y otra pata y la de hacer reverencias zo) en que se presenta el refuerzo_ Tan detaUado fue ese análisis, y tan poderosos
y rascar. o los efectos delineados en él, que probablemente haya sido la principal contñbución
¡ •
I de Skinner a nuestra comp~nsión de las variables que influyen sobre el aprendizaje.
Skinner distinguió entre cinco tipos de reglas que gobiernan las contingencias entre
respuestas y reforzadores: 1) dar un refuerzo a una respuesta constituye un refuerzo o El prognma de refuerzo es la regla seguida por el ambiente -yen un experimento, por el
positivo; 2) dar un refuerzo no contingente produce condicionamiento supersti- aparato- para detenninar cuál de las muchas ocum:ncias de una respuesta será reforzada. (Rey-
nolds, 1975, páginas 65-66.)
cioso; 3) dar un estimulo adverso, o 4) elimilar el reforzador positivo contingente
de una resp4esta es castigo; y 5) la eliminación de un estimulo adverso contingente
de la emisión de una respuesta es refuerzo negativo. La mayor parte de nuestras consideraciones hasta este lugar se han referido a
las contingencias como hechos "todo o nada". O sea, la conducta era seguida por el
reforzador o no lo era. En el mundo real, empero, el refuerzo es a menudo rfgo que
El condicionamiento supersticioso ilustra el punto de vÍ!ta skinneriano de que
se presenta°sólo a veces. Si para mantener una determinada operanle fuese necesa-
los efectos del reforzador son "ciegos" en relación con la conducta rUlal del organis-
rio el refuerzo de cada respuesta, la mayor parte de nuestras conductas. y en
mo (Skinner, 1969). La ocurrencia de cualquier conducta es predecible mediante la
particular los ejemplos de conductas supersticiosas que hemos visto, se extinguirían.
observación de las consecuencias ambientales que tiene, con prescindencia de las
Ese refuerzo que se brinda a veces a una conducta se llama refuerzo intermitente, lo
intenciones del experimentador o del conocimiento, por parte del organismo, de la
opuesto del refuerzo continuo, O Re.
verdadera relación existente entre su conducta y sus reforzadores. Un ejemplo de
El ambiente puede conectar reforzadoRs a respuestas sea por efecto del núme-
ro de respuestas emitidas o por la ocurrencia de la respuesta dentro de un intervalo
de tiempo específico. Esos programas se denominan respectivamente programas de
:! Mu.:hos skinnerianos emplean el término "reforzador neptivo" en forma intercambiable
con "estimulo adverso"o Este último ténnino sólo se utiliza para mcnl:Íon;1r un tipo de estimulo razón y de intervalo y pueden ser fijos (predecibles por el organismo) o V3riables
yono una contin¡:en.:ia (como lo serían el castigo o el refuerzo negativo). Debido a la posil-!c (probabilísticos). Estos términos se explicarin más claramente al considerarse cada
confusión entre reforzador ncgativo y refuerzo negativo, en el presente texto sólo se emplearán tipo de programa simple. Debido a la profunda influencia que los programas tjerc/
los términos -consecuencia advcna" y uestimulo advcno"o

00//:
o/

También podría gustarte