Está en la página 1de 79

Discúos experimentales

y cuasicxpcrimcntalcs
en la investigación social
Disenos experimentales
y cuasicxperimentales
en la investigaci{>n social

Donald T. Campbcll
Julian ( :. Stanlcy

Amorrortu editores
Buenos Aires
Director d(' la hiblioteca d(' sociología, l .uis A. Rigal
/•,'xjJeri111m!rtl r111d (¿11r1.1i-/•,'x'jil'l'Í111m/11/ /)l'signs jor Resmrrh, Donald Nota preliminar
T. Camplwll y J1tli;u1 C. Sta11lcy
O Rand McNally Sé Cornpa11y, ]<)(j(j
l'rinwr;1 <·dici<'>11 ('11 ingl<·.s, 1<)(i(i; S<'Xta rcin1pn·sitn1, 1970
l'rinHTa nlició11 ('ll castellano, 1!l7:\; primera reimpresión,
1!)71; segunda r('i111presió11, J<)7S; tncer;1 reimpresión, 19S'.!;
n1art;1 reirnpff.siú11, J<)í--\8; q11i11L1 r('i1nprcsi<'>11, l!)!)l; sexta n·-
i111pre.siún, ]()<):\; s[·pti1na n·in1prcsi<'>n, l!)!)!í
Tr;1d11cciú11, IVL111ricio Kitaigorndzki Este trabajo apareció originalmente en el libro compilado por
Re\'isiú11, _lo.s[· ( :. Onics (' lb,trs N. L. Gagc, Handbook of rcsearch on teachin[!, ( Chicago:
Rand McNally Co., 1963), con un título algo distinto: «Di-
l l11ic1 cdici(>n ('11 castclla110 autori/;td,1 por lúmd 1\IcN11flv & seños experimentales y cuasiexperimenta1es en la investigación
C:0111/)(JII_,', Cliicago, y d<'i>idalll('llle protl'gi<Lt ('ll tocios los paí- educacional». Por esa razón, las primeras páginas y gran parte
ses. Q11('cLt ]l('dlO el depósito que prni('IH' la ley nº 11.7~::I. de los ejemplos ofrecidos versan sobre la investigación en el
Cc·J Todos los d('r('( lios d(' b edición c1stdLt1i;1 rc.scrvados por campo educativo. No obstante, si se examina la lista de re-
i\rnorrorl 11 ('ditores, S. A., Paraguay I '.!'.!:,, 7" piso, Buenos Ai- ferencias bibliográficas al final de la obra, se observará que
res. el estudio que aquí presentamos extrae sus datos de todas las
ciencias sociales, siendo por tanto de aplicación general sus
1.;i reprod11cciú11 total o parcial de este libro <'ti l,,rrn,1 id{·ntic,1 recomendaciones metodológicas.
o rnodificada por c11alq11ier medio mecínico o ekctr{n1ico, i11-
cl11y('11do lútocopia, grabación o cualquier sistema d(' alin,1ce- Donald T. Campbell
11ami('f1to y n'n1pn;1cit,n de información, no ,\lllorizad,t por los Julian C. Stanley
editores, viob d('rcclios rcsc1Yados. Cualquier utilizaci(m debe
S(T pn·vianH·nte solicita<b.

l11dustri,1 ;irg(·11ti11a. l\fade in Argentina.

Impreso en los Talleres Cr:1ficos Color Efe, Paso 192, AYellane-


<la, proúncia ele Buenos Aires, en junio ele J 99:í.

Tirada de esta edición: 2.000 ejemplares.

7
l. Introducción

Examinaremos en esta obra 1 la v,1licle:,: de dieciséis diseiíos


experimentales respecto de dllcC amenazas corrientes rr la in-
ferencia válid,1. Pot «experimento» enkndemos aquella pal'te
de la investigación en la cnal se manipulan ciertas variables y
se observan sus efectos sobre otras. C<'1wicne aclarar que el
propósito particular de este libto no es estudiar el diseño ex-
perimental dentro de la tradición de Fishcr l 19 25, 19 3 5],
donde el experimentador, con pleno dominio de la sittución,
progrnnrn tratamientos y mediciones a fin de lograr la mejor
eficiencia estadística, único objetivo al que obeckce la mayor o
menor complejidad del disefio. Los diseños aquí analizados
son t,111to más complejos cuanto mayor es la inflexibilidad del
ambiente; es decir, en fo medida en que el experimentador
carece de control absoluto sobre fa situación. Aunque hay
no pocos puntos de contacto entre nuestro tratamiento y el
de la corriente de Fisher, juzgamos apropL1do dejar la ex-
posición de esta última páta obras de mayor envergadura,
corno las de Brownlee [ 1960], Cox [ 19 58], Edwards [ 1960],
Ferguson [1959], Johnson [1949], Johnson y Jackson
[1959], Lindquist [1953], McNemar [1962] y Winer
f 1962]. ( También puede consultarse Stanley, 1957 b.)

1 La preparación de esta obra, en la que colaboraron Keith N. Clayton


y Paul C, Rosenblatt, contó con el auspicio <le! Proyecto Psicología-
Educación de la Northwestern Univcrsity, bajo el patrocinio de fa
Carnegie Cor:,orntion.

9
2 . El problema y sus antecedentes íuu<1lados por azar». «Así como se puede lograr _l;t represen1-
tividad por el método aleatorio (_ ... ) ta11:1b1e1: se pue e
conseguir la equív,1lencia por el m1sm_o_ medio, s1empr~ ~¡ue
el número de sujetos que havan de utilizarse sea lo sufic1e1~-
, 41 ?
tcmcn te grande,> ( pag. 1~n :n m··ro punto se antl-
• : ·1··.am b.' .
cipó a Pisher: fo introducciOn del d1s':no del cuadrado latino
/vfcC:{ill como modelo con el r<Ítlllo de «cxpcrímento rotata,no», CJ}1e por otra parte
habfon utilizado ya Thorncl1ke, McLnll y Chap1:1an [1916],
tanto en forma:; 5 >; 5 como 2 X 2, unos 10. anos, ~ntes de
1'.n 1'J?), W /L 1\1cCall publicó un Jibto titulado How to
que Fisher r J 926] lo incorporase de modo _s1st:;11~;ICO a su
ex¡,crímcn! in ulucation ( Cómo experimentar en educación).
Nuestro propósito es exponer aquí en forma actu.alizada los esquema de discífo cxJ;l:rime!1tal con aleato_nzac1on." . .
La forma en que McC,11] ut1l1z,1 el "experimento rotator10»
intcn:scs indicados y las considcracicncs apuntadas en dicha ilustra nrnv bien el énfasis t;rnto de su obra como de la pre-
ohra; comenzaremos, pues, formulando una evaluación acerca
sente. El «~xperimcnto rotatorío» :;e introdu~c, no por razones
de ella. Decía McCall en su introducción: «Hav excelentes de cficienci:1, sino m(is bien pnra logrnr algun conrr~l cuando
libros y tratados que exponen cí manejo estadístico de datos 110 es posible la a,ig1rndón aleatoria a grupo; cqu'.valentes.
experimentales, pero muy pocos acerca Je cómo obtener datos
Con una intención similar cxaminar?rnos aqm las m1~crfec-
fülccuados y correctos a los cuales poder aplicar el procedi-
ciones de mucho~ progrnmas expetlment~les, ~bogando no
miento estadístico». Este enunciado continúa siendo hoy tan
cÍCl'to que bien puede servirnos de leitmotiv. Aunque Ja obstante por su aplicació'.1 en aq:1ellas c_on~tgura~wn:s :n ,.que
110 hav,1 modo de recurrir a mc¡ores d1senos exper!mental~s.
influencia de 1a corriente fishetiana remedió la sítuación en
En este sentido, fo mayor pHrtc de los dise~os analizados, 1~-
algunos aspectos fundamentales, su efecto más conspicuo
cluso el «experimento rotatorio» no aleatonzado, se denomi-
parece haber sidn c1 de afinar y perfeccionar el análisis estr.- nan diseüo, cuasíexpcrímentales.
dístico, 1rnfa que el de ayudar a conseguir «datos adecuados y
correcí.os».
Quizá por su orientación práctica y sentido común, y porque
no pretende constituir un aporte capital, el libro de McCi 11 La desilusión provocada por los experimentos llevados a cabo
representa un clásico insuficientemente valorado todavía. en el campo de la educación
Cuando apareció, dos años antes de la primera edición de
Statistíca! methods Jor research workers (Métodos estadísticos En esta obra nos declaramos partidarios dd método e.xperi-
para investigadores), de Fisher [ 1925], no había nada com- mcntal como único medio de ,:anj,ir las d!sJmtas relativas a
parable cua1itativéll1lente a él en el ámbito de la agricultura ni la práctica educacional, única forma de venficar adelantos en
en el de la psicología. Se anticipó en varios puntos fundamen- el campo pedagógico y único mé:odo P:tra acumular u:10- saber
tales a las metodologías ortodoxas de esas dos ciencü1s. Acaso al cual puedan introdudrsclc me1orns 5111 cmr~r el peltbro d_e
la más importante de las contribuciones de Fisher haya sido fa que se descarten capríchosament~ los. conoc:m1ent(:s ya adqui-
idea de formular la igualación preexperímental de grupos por ridos a cambio de novedades de inferior ca~tdad. S:~ embargo,
aleatoriz;1ción. con nuestra enérgica defensa de la expenmentacmn no pre-
Esta idea, y el consecuente rechazo de Ja tentativa de llegar tendemos significar que este énfa?is sea nuev?. Como _lo ma-
a tal igualación por equiparación (pese a su intuitiva atracción nifiesta la existencia misma del libro de l'v~cCall, en t1e11;pos
y potencialidad de error), no mereció Lícilrnente 1a aproba- de Thorndike una ola de entusiasmo expenmental reco:na el
ción de los investigadores del ámbito educncional. En 1923, ámbito de la educación, alcanzando quizá su punto culmtnante
McCall hnbía comprendido cuáles eran los elementos cua-
litativos fundamentales del problema. Dio, como primer mé- 2 Kendall y Buckland [1957] afirman que el cuadrado latino fue in•
todo para establecer grupos comparables, el de los «grupos ventado por el mattmático Euler en 1782. Thornd1ke, Chapman Y
McCall no utilizan esta expresión.

10 11
en 1a década del veinte. Aquel entusiasmo se convirtió des de nuestra ciencia está constituida de tal manera que hay en ella
pués en apatía y rechazo, así como en la adopción de nuev:1s muchas más respuestas erróneas que correctas, cabe prever el
doctrinas psicológicas no susceptibles de verificación experí- fracaso de la mayor parte de los experimentos. Hay que inmu-
111c11tal. Good y Scites [1954, págs. 716-211 han documcn- nizar, pues, de algún modo a los jóvenes investigadores contra
rndo un pesimismo general, que se retrotrae quiz:15 a 1935, ese resultado y, en general, justificar ante ellos la experimen-
y citan incluso n Monroc [ 1938 L aquel decidido defensor de tación sobre fundamentos más realístas: no como una panacea,
la experimentación controlada nos han dcsilusion,1do», Cabe pero sí como el único camino hacia el progreso acumulativo.
destacar, a(k:in:Ís, qnc el trfosito de ln experimentación a la Tenemos que inculcar en nuestros discípulos la expectativa
redacdcín de ensayos, acompaífado a menudo por una con- del tedio y la decepción, y el deber de la tenaz persistencia,
versión de! conductismo tipo Thorndike a b psicología de fo actitudes ambas que con tanto éxito se ha logrado irnplantar
guesbd t o al psicoan,ílisis, se produjo con frecuencia eri per- ya en las ciencias biológicas y físico-naturales. Hay que mu-
sonas que contaban con una buena furnrnción en la tradicitín pliar el voto de pobreza de nuestros alumnos, de modo que
experimental. no solo se avengan a trabajar con insuficientes recursos finan-
P,1ra evitar que se repita este dc:,cncanto, debemos conocer cieros sino a admitir la insuficiencia de sus resultados expe-
lus orígenes de la reacción m1teriur, procnrnndo sortear las rimentales.
falsas expectativas que cor:dujcron a ella. Merecen destacarse Más concretamente: debemos ensanchar nuestra perspectiva
varios aspectos. Ante todo, se pretendié, asignar a los resulta, temporal, y reconocer que la experimentación continua y múl-
dos de 1n experimentación un cierto ritmo y grado exagerado tiple es más propia de la actividad científica que los experi-
de progreso, a! par que se menospreciaba injustificadamente el mentos únicos y definitivos. Las pruebas que reafo~fü11os hoy,
conocimiento no experimental. Los primeros ddensorcs s11¡m- si llegan a tener éxito, exigirán repetición y validaciones cn1,.
sieron que el progreso en la tecnología pedagógica había si<lo zadas en otros momentos y en otras condiciones antes de con..
lento solo porque no se había aplícado a ella el sistema cientí- vertirsc en adquisición estable para el acervo científico y ser
fico: creían que la práctica tradicional era ineficaz solo por- susceptibles de segura interpretación teórica. Además, mm
que no h<1hía sido fruto de la experimentación. Cuando se cuando reconocemos que la experimentación es el lenguaje fun-
demostró que los experimentos eran a menudo tediosos, equí- damental de la demostración y el único tribunal decisivo para
vocos, de reí terahilidad insegura y ratíficadores, por lo común, resolver los desacuerdos entre posibles teorías rivales, no es
ele conocimientos precientíficos, los fundamentos excesivamen- previsible que los «experimentos cruciales» que contrapongan
te optimistas con qu,e se había querido justificar la experimen- a las teorías opuestas vayan a producir resultados claramente
tnción quedaron minados por la base, y al primitivo entusias- definitorios. Cuando se descubra, por ejemplo, que observa-
mo sucedió el desilusionado abandono. dores competentes sustentan puntos de vista muy dispares en-
Aquella sensación era compartida tanto por los observadores tre sf, será razonable suponer a priori que ambos habrán encon-
como por los propios involucrados. Entre los experimenta- trado algo válido sobre la situación estudiada, y que ambos
dores se advertía una innegable aversión hacia la expe- representarán una parte de la verdad completa. Cuanto m,1yor
rimentación. Para el investigador normal muv motivado el sea Ja controversia, más probable será que así ocurra. Pode-
hecho de que una de las hipótesis que su;tent¿ no sea cor;fir- mos, pues, esperar en tales casos un resultado experimental
mada resulta por demás doloroso. Como animal bíolóoico v de carácter mixto, o con sutiles variaciones en el saldo de ver-
psicológico, está sujeto a leyes de aprendizaje que lo co1;duce~ dad entre una prueba y otra, La posición más sensata -lo-
inevitablemente a asociar este dolor con los estímulos y acon- grada en gran parte por la psicología experimental ( por ejem-
tecimientos inmediatos. No es extraño, pues, que tales estí- plo, Underwood, 1957b)- evita los experimentos cruciales,
mulos estén constituidos por el mismo proceso experimental reemplazándolos por relaciones e interacciones dimensionales
de modo más vívido y directo que la «verdadera» fuente de la a lo largo de muchas gradaciones diversas de las variables.
frustración, a saber: la inadecuada teoría. Una situación tal Tampoco hay que olvidar los muy perfeccionados procedimien-
puede inducir, inconscientemente quizás, a evitar o rechazar tos estadísticos que en época reciente se han ido introduciendo
el proceso experimental. Sj, como parece probable, la ecologfo poco a poco en la psicología y la educación. Durante su período

12 1.3
de mayor activi(Lid, la c:,;:r1eriml'ntación educacional avan;,;o ¡:;'os se ¡,,ü1 ens:,y;ido muchos e:,foques distinto5, si de dlcs
],_·1,la;rn·nt,', cm¡1),,:mc1o rn"cdios \ procedírnicnrc :s hurdns. 1 ,:!r:unn~ 1,m, nl•ri,-nido m,:·iore:; rc-,ult*los qne olí"<::; v los que
;\lcC,dl l 1)25J y sus cun:empor;i;;•:us rrn!1,'.c1t:oll ::,vc,;tiga,·i«- l :¡:;-:1lll 1 ·,·:, lk: :,upu11cr ,¡uc luh,;ír1 :,id,-, i~,s H.i!-
:1cs en las cuales se estudínba una sola vnri,,blc pur vez. Pnrn dos con 111<,yor '"'i:sistcnc1:1 por ,,,;s CffJclores, imitados ¡,or
],; l'l10r111C complc:icfod que caracteriza las situaciones de aprcn- ,,,ros y í ,:,snüti,:,,,, a fas generaciones s:g,,ientes. hs cos,.um-
, :;/;1jc 111;::u110, :1< 11•,·llo fL'~,:,ltaha ,1, n1asi:1ek, lento. f :uy se ~:,l,c '.:,¡t_:~; l"C~:,l1, 1 ni..cs lot~(5 ~,11(~ f'.iUC-'ii n t·~~:¡_11, 11":d 1111 \i~llic.:,::_: y
b grnn importtmci,1 que pueden asumir diversas co1,Língencias, :woh,1do ':t,lx:oni1·,;to de u,das bs pdctius posibles. •
d,:pcm]ícn; ,:s de Li «acci..',n» conjunt« de dos o rn:ís variahlcs ¡\:ro el ¡:unto de. corte :•:,_Jcctivu de e'.1U~ .::.:voluci~_-)n se u·1.:'oa
• 11:ílcs. ;·.1t11kv í:'Vihr, Ht,O, 1' 1(í1h, 11!<;!!', 19(,?i !i1i1~/ in;¡-i·,Tf'.-:o {: .indo '.-:1_ in ;·1·;1:,Li ;;r ;1 _L¡ ::lr{tv·;.
Ji .. L:l'< c;·,.ndt-
:,, mlcy v 'w' iley L1~62 J y ottus ]1,1n dcst:icado h .!i!,pcriu~a ~luucs Je c,L)~·,Cfv;tc:_¡_(\11~ L:u1t.\: i-i~ic~)s OJJ.c(· ps.icoJ1.__;g1cas, !i_-;_._;iail
necesidad lle cvalu,1t tales interacci,,ncs.
T,o~: cxp,_r'rncntc: pnedu, incltür nlg1rn:1, v:1riahks en ci1:1l- :\': ;:~¡,::-, e;; ,í~~:r!t,l:',1:·11~~~1~1~1,i~';r;~ecl\;~~v1~· :~:11:t ct ;~;!!11~ q LJ(C::b
1 0

utiil'.fü <k dos :.;(·ntid()S e, ,~·n :.un. .i.1¡~: •• 1 la ve>:_ l?ur c¡s._'rnplo,, i;, 'Í;¡·:i.:1-1(:j{·i,_-¡¡ ~ic::;i,·-.. ;·J ¡¡·¡·,rH.')) t•.i)ti')'.\ ·--~' i_ f)f::;:.-( ék: pí:1

c'urpor,111,h al discüo más de un:\ variable: «independiente>, ~-=.5·_.:plora..::i:_·;n y sé!f-0c•cJJJrL • se cc"1Lcrr1pL1, _put:s> L-1 ...~xpcti1-c:( n-
{ ,cxo, ¡;r,ulo esc,,l.ir, mé,odn col' que se enseña aritm~tíca, --~-~:cion en sJ nllsr1·1:·1 corno fuente d.c idea~ neccsnrJnrncnte cnn-
1ilo v l:!:;1:1rín ,k iu:: ,,¡,,,s d1..' i1n¡·,:-c!lta, ,·:,·),y;·,, c1nplc:m- :·:► di(-1 ( 1 i< :·(111.
1 r,_·Lic.it'-:n ;1.i H'r tL.~i..1;(_-í(1t¡;-d. :..;Jt ¡n~ls ·::il~O
, ki m/.s de un,l v,1 ria ble ,dc¡1cnLÍÍL·11tc» { número de errores, curno r1Lc:.m1smo de refr.,,-,ción superpuesto a las c1cumuhcio-
v,·Íocida.J, divcrs:1:; pruchis, etc ) , Los procedimientos de n,,s proh.,blcmcn,c valíc,,:,s de b Í:.ráctic:1 scnsav,. T'ropu,g,;Jt,
T'i·-;]wr :;c•n rnulti\ ,1ri,lllo,: d\ el ¡,ri1ncr sen\ ido v univari,1dos J!U('t~, ~111;:. cícnc'J;,¡_ exrH._'61·,·1\'•nt1J de i:1 cduc:.H..-i<)U ne, in1p1ic,; te--
u1 cí scu,umlo. LsL1dísti,il, makn,átiL'li:; ,·01111.> 11.,,\, y Cn:t,1a . ,' ,d1;,r ,.: s:1l.1ci: íLid1,:io:,,1!.
(í,,sikan • 1 l 959 J trntan de encomr,1r dis,'iÍOs y ,rn,llisis que Algnnos lcctmcs ::brígad,, tal vc,o, la sos:-,,:cha de que la ana-
1•1,ifíquc-n :1mhns h,r111ns de diseños 1mtltiv,iriados. 'Ld vez per- !ngfa con el esgw:uia ev,,1utivo c.Lirwinírmo se cornpUque cm
111,1111·, ic1,du ,tkri:\:,: ,1 L1 t'\·1d1KÍ(<11 de i:tk:s dise11ns 11ucd:1n los 1,1~:l.<Jrc~ J"--~ Cül';~:..·tet csr-~'--_cífic;1nu, rttc hui~í;!l"IU. ( ,.:i·;J1do /tL.1.1.1

in~c~tig,htores en el campo de 1n e,lucacíón reducir. la brec·ha, Pc;rcz, director de escueh. tiene que decktr entt,· ,1dopt;,;, un
por lo curnún dum1silldo ,tmplia, entre la exposícíún en b li- lihro de texto modificadu n continuar con la ver~íc',n anterior,
,, ral u.:1 ,·,:¡,n:i,di1:1d:1 tlc tm pn1·ic'.dirnÍ,:'1to cst1,1í,,tico 'i su < ,; prnh,ildc q_!lv h~1g:·1 :-.;¡_-¡ clt:cc.ión funtL.fr:,Jusc C!l rLitc,s 1.n>;u_
;iplirncitn práctica ¡¡ iuvcstígm·iones de enverg.1durc1. 1;<:icntc:,. A1J:1rte de la e:Lciencia misma para fo cnscúfü1z:, y
[\o cabe duda de qne u na en pací r,1ción 1rnis a fondo de los el aprendizaje, son muchn.s las consideraciones que habn¡ de
invcs1i1•:1c!ur,:, e,Lic:ll ion:t1cs en t,\·nirns modernas de estadís .. tnmnr en cucnt:1. F,l director har6 lo con•.:ctn en m1;, de es,:1,,;
c·x¡Jcr;111cntnl ¡•crrnil11ía ckv:,r la ca(íd,d de Li experímen-
LÍ<ü ,_ius fnrnia.s po,,iblc::: ri.:l<:1,1endo t·l lihru :.rn ct1:rndu c:e,1 t:.1i:,
udón pcdagógirn. bueno o mejor qne el revisado, o adoptando este último cuan-
do sea superior al primero. Pern puede cquivocarse también
de dus marn:ras: l'l'tenic11,\i el 1ibro antiL'uu c·u:rn,kJ d rn1<'\'0
Concepcícín evolutiva sob?e la ciencia y !Ir acumulación es mejor. o adoptando este cuando no e,,,' superior al prim,:ro.
de conor)nzientos En cada una de las dos elecciones erróne,,s es de rnponer que
,e ptnducidn incmwcnicnres diversos: l ': nrnvor costo fí11:rn-
Como fondame11Lo de lo expuesto en los p{irrnfos precedenws c1ero y de:: gasto de encrgfas; 2) costo para el Jir,:ctor, en for-
\' lo qt,c se expondrá en los que siguen señalamos una con- ma de quejas de los maestros, padres y miembros del consejo
ce:pcíón c·vnluti'.,a del conocimiento [Carnpbcll, 1959]_, según escolar; 3) costo para los maestros, los alumnos y la sociedad
b cual Lt apLirncíi'in _pr.krica y d ,·(11mci111ic11tu cín1ti±icn son a c,11 isa de una ¡wor instrucci6n. Estos ,\,stm;, e·:alu:1do, ~:n
el resultado de L acumulación de cierras tentativas seleccio- término~ de dinero, energía, confusión, menor aprendizaje y
nad.1.s v remanentes del caudal de observ,1ciones recogidas por mayor riesgo personal, deben sopesarse frente a la probabili-
Li o:r)(:ricncia. Fsta concepcit'in i11,:,pir:1 gri,1 respeto por la tra cbd de: qc1e se ¡-,,:,itl.nzca L',lda u11,1 de di,·h,\s ,iltnnatív;is, cisí

didón en la práctica pedagógica. Si en el trascurso de los si- como ia de que se detecte el error mismo. Si d director torna

14
su decisión sin suficientes elementos de juicio, fruto de una trn ideal lo constituye la selección de diseños ricos en una y
investigación a fondo, sobre el costo 3 ( peo~ instr?cción), es otr,1 vaíídez. Así o¿urrc, particularmente, respecto de la in-
posible que exagere los costos 1 y 2. T.os rn11pes vienen b,ara- vestigación sohrc méroJos Je enscf:íanza, donde el desiderátum
jados en favor de un criterio conserv¡¡dor: mantener el libro será la gcn,:ralizaci6n a situ,1cioncs prácticas de carácter cono-
antiguo durante un año más. Cabe, sin embargo, tratar de pre- cido. T;11110 las distiudoncs como las relaciones entre estos
parar un experimento con ambos libros a In vez, de acuerdo dos tipos de consideraciones de validez irán haciéndose más
con un esquema de tcorfo de la decisión [ Chernoff .Y 1\tfoscs, cxplíci tas a medida que se las ilustre durante la exposición
1959], y adop1ar un:;, resolución qne tome explícitamente en de discfios e:mcdficos.
cuenta los diversos costos y prnbahilida<lcs. Cómc conseguir Con relación· a la vdiJe.z i11ter11a, presentaremos ocho clases
que las cuidadosas ddihcracioncs de un excelente administra- distintas de vnrí,1lilcs externas yue, de no co111ml:írsclas en el
dor educativo se aproxímen a este modelo de teoría de la discí10 experimental, podrían generar efectos que se conftin-
decisión ts nn grave prnblema, cuyo 1:studio bien vale la pena dirfan con el del cslÍnmlo experimental. Constituyen los efec-
encarar. tos de:

1. TíístorÍrí, los nconlccimientos específicos ocurridos entre la


Factores que atentan contra la validez tanto primera y la segunda medición, nde1rnís de la variable expe-
interna como externa rimental.
2. Jvfoclumcirín, procesos internos de los participantes, que
En los próximos capítulos de esta obra se describen doce fac. <1pcran como resultado del rncro paso del tiempo ( no son pe-
tares que arncna:,;an la validez de varios disefíos cxperím~n- culiares de los acontecimientos en cuestíón), y que incluyen el
talesY Cada uno de dichos factores se explicará con to<lo detal]c aurncn to de la e,hd, el han:,brc, el cansancio y similares.
al exponer los diseños a propósito de los cuales constituye un 3. Admi11istració11 de tests, el influjo que 1a administración
problema particular; diez de los dieciséis diseños se presenta- de un test ejerce sobre .los resultados de otro posterior.
rán Hntes de completarse la lista. A fin de lograr una perspec- 4. Tnstmmcntacüín, los cambios en los instrumentos de me-
tiva más elata sería conveniente, sin embargo, que demos dición o en los observadores o calif¡cadorcs participantes que
una lista de dichos factores, así como una guía general acerca pueden producir variaciones en las mediciones que se obten-
de los cuadros 1, 2 y 3, que resumen parcialmente el análisis. g;:111.
Es fnndmnenrnl a este respecto distinguir bien entre validez '5. Regresión estadística, opera alH donde se han seleccionado
interna y validez externa. Llamamos validez interna a la míní .. los grupos sobre la base de sus puntajes extremos.
ma imprescindible, sin la cual es impo~ible Íf1:terpretar el ~o- (1. Scsgus rc~:ultantes en una selección diferencial de partici-
delo: ¿Introducían, en realidad, una diferencia los tratamien- pantes para los grupos de comparación.
tos empíricos en este n~so experimental concreto? Po~ .s'.1 7. Mortalidad experimental, o diferencia en la pérdida de
parte la validez externa plantea el interrogante de la pos1bd1- particípantes de los grupos de comparación,
dad Je J!.Cfteralización: ¿A qué poblacion~~', situaciones, varí~- 8. Interacción entre la selección y la maduración, etc., en al-
blcs de tratamiento y variables de med1c1on puede generali- rrunos dr. los diseños cuasiexperimentales de grupo múltiple,
zarse este efecto? Ambos criterios son sin duda importantes, :orno el iO, se confunde con el efecto de la vHriable experi-
aunque con frecuencia se contrapongan, en el sentido de que rnen tal ( es decir, que podría tomarse por él) .
ciertos aspectos que favorecen a uno de ellos perjudican al
otro. Si bien la valícle.z interna es el sine qua non, y a la cues- Los factores que amenazan 1a validez externa o representati-
tión de la validez externcl, como a la de la inferencia induc- viclacl, y que vamos a analizar aquí, son:
tiva, nunca se pHede responder plenamente, es obvio que nues-
9. El efecto reactivo o de interacción de las pruebas, cuando
3 Gran parte de esta exposición se funda en Campbell [1957]. En
general, no se harán referencias particulares a esta fuente. un pretest podría aumentar o disminuir la sensibilidad o la
calidad de la reacción del participante a la variable experimen-

16 17
tal, haciendo que los resultados obtenidos para una población 3. Tres diseños precxpcrimentales
con pretest no fuer,m representativos de los efectos de la va-
riable experimental para el conjunto sin pretest del cual se
seleccionaron los participantes experimentales.
1O. Los efectos de interacción de los sesgos de selección y la
variable experimental. •
1 l. EfecLns reactivos de los dispositivos experimentales, 1. Estudio de caso con una sola medición
que impedirían hacer extensivo el efecto de la variable ex-
perimental a las personns expuestas a ella en una situación no Gran parte de las investigaciones actuales sobre educación se
experimental. ajustan a un diseño en el cual se estudia un solo grupo cada
12. Illtcrferenclas de los tratamientos múltiples, que pueden vez, después de someterlo a la acción de algún agente o trata-
producirse cuando se apliquen tratamientos múltiples a los miento que se presuma capaz de provocar un cambio. Estos
mismos participantes, pues sm:lcn persistir los efectos de tra- estudios podrían diagramarse de la siguiente forma:
tamientos anteriores. Este es un problema particular de los
diseños de un solo grnpo de tipo 8 o 9. X O
En la presen ración de los diseños expctimen t,1les se adopta-
rán un código y unos símbolos gráficos unifotmes, a fin de Como ya se ha destacado [p. ej., Boring, 1954; Stouffer,
compendiar la mayoría, si no la tornlidad, de sus características 1949], tales estudios adolecen de tan absoluta falta de con-
distintivas. Una X representará la exposición del grupo a una trol que su valor científico es casi nulo. Presentamos este
variable o acontecimiento experimental, cuyos efectos se han diseño como punto mínimo de referencia. No obstante, a cau-
de medir; O hará referencia a algún proceso particular de ob- sa de la continua inversión en esta clase de estudios y de la
servaci6n o medición; las X y O en una fila dada se anlican extracción ele inferencias causales de eIIos, será imprescin-
a las mismas personas específicas. La dimensión repres~ntncfo dible formular alguno que otro comentario. El proceso de com-
de izquierda a derecha índica el orden temporal, en tant) paración, de registro de diferencias o de contrastes es funda-
que las X y O dispuestas en forma vertical señalan la presen- mental para la comprobación científica ( y para todos los pro-
cia de simultaneidad. Para hacer ciertas distinciones impor- cesos de diagnóstico del conocimiento, incluso aquellos vin-
tantes, como entre los <lisc:fíos 2 y 6 o entre el 4 y el 10 hav culados con la retina). Resulta ilusoria cualquier apariencia
que utilizar un símbolo R, gue indica asignación aleato;ia ; de conocimiento absoluto o intrínseco sobre objetos singula-
diferentes grupos de tratamiento. Esa aleatorización se concibe res aislados. La obtención de datos científicos imr,lica, por
como un proceso que se produce en un momento dado, y sirve lo menos, una comparación, cuya utilidad depende de que las
para lograr, dentro de límites estadísticos conocidos, la igual- partes integrantes se estructuren con el mismo cuidado e
(fad de los grupos antes del tratamiento. Agregaremos a ella idéntica precisión.
~tra convencíón _grá.fi.ca: las filas paralelas no separadas por En los estudios de casos del diseño 1, se compara implícita-
]mea de\mntos sigrnfican grupos ele comparación no igualados mente un caso único, cuidadosamente estudiado, con otros
por dicho procedimiento. No se ha empleado ningún símbolo acontecimientos observados de manera casual y recordados. Las
para _la equipar~ción corno proceso para conseguir la igualación inferencias se fundan en expectaciones generales de cuáles hu-
prev1.a al tratanuento de grupos de comparación, porque el valor bieran siclo Ios datos de no haberse producido X, etc. Tales
de dicho proceso se ha exagerado mucho y suele más bien estudios suelen requerir una tediosa recopilación de detalles
conducir a inferencias erróneas que contribuir a extraer con- concretos, cuidadosa observación, administración de tests y si-
clusiones válidas. (Véanse más adelante el análisis del diseño milares, y en tales casos se corre el riesgo de hacer precisio--
1O y la sección final sobre diseños correlacionales). En el di- nes injustificadas. ¡Cuánto más provechoso sería el estudio si
seño 9 se ha utilizado explícitamente un símbolo M para ese caudal de observaciones se redujese a la mitad, aplicándose
identificar materiales.

19
18
el esfuerzo ahorrado al estudio igualmente cuidadoso de un convertirse en una hipótesis rival aceptable, tal acontecimiento
apropiado caso de comparación! Parece hasta casi falto de ética debería haber afectado a la mayor parte de los estudiantes que
el aceptar hoy, como tesis de doctorado en el ámbito educa- integran el grupo examinado (p. ej., en algún otro perío-
cional, estudios de casos de esa índole ( es decir, que implican do lectivo o por medio de una noticia periodística muy difun-
un solo grupo observado una sola vez). En ellos, los tests dida). En el estudio escolar realizado por Collicr en 1940,
«estandarizados» solo ofrecen una ayuda muy limitada, puesto sobre el cual informó en 1944, se produjo la caída de Francia
que las fuentes antagónicas de diferencias ( distintas de X) mientras los estudiantes leían abundante material de propa-
son tan ,1bundantes que tornan casi inútil el grupo «están- ganda nazi; los cambios de actitud comprobados parecieron ser
dar» de referencia como •«grupo de control». Por los mismos consecuencia, más probablemente, de ese suceso que de la pro-
motivos, las muchas fuentes no controladas de diferencias en- paganda en sí.1 La historia se convierte en una explicación rival
tre el estudio actual de un caso concreto y otros que, plan- m,Ís aceptable del cambio cuanto más extenso es el lapso entre
teándose en el futuro, pudieran compararse con aquel son tan- ;01 y 02, y podría considerarse un detalle trivial en un ex-
tas, que hacn tmnbién inútil su justificación como punto de perimento realizado dentro del breve lapso de una o dos horas,
referencia p tra estudios posteriores. En general, sería mejor si bien aun en tal caso deben investigarse fuentes externas
distribuir el esfuerzo descriptivo entre los dos miembros de corno las risas, las distracciones, etc. La variable historia se
una comparación interesante. relaciona con la característica de aislamiento experimental,
Si se lo toma en conjunto con las comparaciones implícitas de que en muchos laboratorios de física suele conseguirse con
«conocimiento común», el diseño 1 presenta la mayor parle tanta aproximación que el diseño 2 resulta aceptable a propó-
de los inconvenientes de cada uno de los diseños posteriores. sito de la mayor parte de sus investigaciones. Pero en el estudio
Por eso dejaremos el estudio de esos inconvenientes para cuan- de métodos de enseñanza casi nunca se puede suponer un
do encaremos situaciones más específicas. aislamiento experimental tan completo. Por eso en el cuadro 1
el diseño 2 se ha marcado con un signo negativo bajo el títu-
lo Historia, en el que incluiremos un grupo de posibles efec-
tos estacionales o de programación de acontecimientos institu-
2. Diseño pretcst-postest de un solo grupo cionales, aunque también estos podrían situarse al pie del tí-
tu.!o Maduración. Así, el optimismo podría variar con las
Si bien este diseño continúa siendo de gran aplicación en la estaciones y la ansiedad producida por el programa de exáme-
investigación edncacion¡¡l, y se lo considera tan superior al nes semestrales [p. ej., Crook, 1937; Windle, 1954]. Tales
diseño 1 que se lo utiliza allí <lande no cabe hacer nada mejor efectos acaso produjesen una variación 01 - 02 confundible
( véase 1rnís adelante el m1álisis de los diseños cuasiexperimen- con el efecto de X.
talcs), lo presentamos ¡¡quí como un «mal ejemplo» para ilus- Una segunda variable o categoría de variables rivales recibe
trar algunas de las variables externas entremezcladas que pue- el nombre de maduración. Tal corno lo entendemos aquí, este
den atentar contra la validez interna. Esas variables ofre- término abarca todos aquellos procesos biológicos o psicoló-
cen hipótesis aceptables que explican una diferencia 01 - 02, gicos que varían de manera sistemática con el correr del tiem-
opuesta a la hipótesis dE que X causó la diferencia: po e independientemente de determinados acontecimientos ex-
ternos. Así, es probable que entre 01 y 02 los estudia;1tes
hayan aumentado de edad, apetito, fatiga, aburrimiento, etc.,
y acaso la diferencia obtenida refleje ese cambio y no el
La primera de estas hipótesis rivales no controladas es la his- de X. En educación correctiva, que se aplica a personas ex-
toria. Entre 01 y o~ pueden haber ocurrido muchos otros cepcionalmente disminuidas, un proceso de «remisión espon-
acontecimientos capaces de determinar cambios, además de la tánea», análogo al que se produce en la curación de heridas,
X sugerida por el experimentador. Si el pretest ( 01) y el
postest (o~) se administraron en días distintos, los aconteci- 1 En realidad, Collier utilizó un diseño más adecuado que este, que
mientos intermedios pueden haber causado la diferencia. Para en el presente sistema se denomina diseño 10.

20 21
Cuadro l. Fuentes de invalidación para los diseños 1 a 6.
:iuede confundirse con el efecto específico de una X correctiva.
Fuf'ntcs de iúvalidación ( Ní que decír tiene que tal remisión ne se considera «espon-
lutnna Extnn;i tánea>> en ningún sentido causal, sino que representa más bien
los efectos acumulativos de los procesos de aprendizaje y pre-
siones mnbientalL's de la experiencia global diaria, que se pro-
ducirían aunque no se hubiese introducido ninguna X.)
Una tercera explírnción rival entremezclada es el efecto de la
rea!iz,,cíó¡¡ de pruebas, el efecto del prctest mismo. En prue-
bas de rendimiento e inteligencia, los estudiantes a quienes se
somete a ellas por segunda ve%, o a mw de sns variantes,
etc., suelen desempcfiarse mejc,r que los que las encaran por
f)isí'fios
vez primera [p. ej., Anastasi, 1958, págs. 190-91; Cane y
¡;recxperimentales Hcim, 1950]. Esos efectos, que alcanzan de 3 a 5 puntos
l. Estudio de caso de CI en promedio para sujetos sin experiencia previa, se pro-
con una sola
mediciún ducen aun sin haberles hecho comentario alguno acerca de sus
X O puntajes o errores en el test anterior. En las pruebas de
2. Di:-:C'ño prde.st- + personalidad ::;e advierte un resultado similar: en las segundas
pnste;-;t de 1m
solo grupo se observ,1, en general, un mejor ajuste, aunque en ocasiones
O X O se halla también un efecto altamente significativo en senddo
3. Comparaci{m con + \· + + contrario [\vindle, 19541. En cuanto a las actitudes hacia
un grupo estático
X O grupos minoritm:ios, una segunda prueba suele indirnr un ma-
o yor prejuicio, aunque los datos disponibles son todavía esca-
Di1·1 ño~
sos [Rankin y Campbell, 1955]. Es obvio que el anonimato,
cxperimental(:s una rnavor conciencia de qué respuesta es la socialmente
propiamente dichos
,iprobada, etc., influirían en general sobre la índoíe del resul-
4. Düwño d(' r+++++ +
grupo (h• control tado. Para tests de prejuicio en condiciones de anonimato, el
prck~t-post(''.it
R O X O r:ive! de a&1ptación creado por las expresiones hostiles presen-
z:¡ o o tadas puede modificar las apreciaciones del estudiante en lo
5. Diseño d<' cuatro + + referente a la tolerancia que existe para actitudes de ma-
grupos de yor hostilidad. En un inventario de adaptación o de perso-
Snlornmi
B O X O nalidad que lleva la finmi del sujeto, la primera administra-
z¡ o o
R X O ción del test forma parte de una situación de solución de pro-
R O hlcmas en que el estudiante trata de descubrir el propósito
fi. Disdio de gn1po + + + + + oculto de la prueba. Si ya ha pasado por aquella experiencia
de control con
postcst ( o si habló con sus amigos sobre las respuestas que ellos die-
{1nicnmentc
R X O
ron a algunos de los puntos más destacados), sabe mejor có-
R O mo comportarse la segunda vez.
Nota: En los cuadroc:. d signo tH:'gntivo ind'.ca qne hay in·.perfecc-íón defi-
Con el problema de los efectos del test se relaciona la distin-
nida; t"l pnt.itivo, que el Lictor nr5 controlado: el inü'r1ot;ativo, la pr('senc1a ción entre las posibles mediciones de su reactividad, lo cual
de tmR pnsihle c,1nsa de pr<"ocupación, y por últinw, el espacio en blanco constituirá un importante tema en todo este libro, así como
sígnifka q11e ,,] factor no es J)erbnente.
Esto3 cmulros H!SUmidos los presentamos con suma renuencia~ ya que pne- una exhortación general a que se hagan mediciones no reacti-
dt•n rPimltar «dc•masiado útiles .. , sí se llega a ('mtfinr ('n dios y no en la ex-
posicic.'m nd•~ <·ompkta y califi<'ada q1_11: se incluye ('H {'} ttxto, Ningún indit'.'ador vas siempre que sea posible. Desde hace mucho tiempo ha
de o Oche rcspctars<•. a nwnos que f'I lector cnn1p!enda. por qué .se :n
ha colocado. En pnrticnlar, va centra el espfrltu tll' f'Stt.> trabajo la crc11ción de
sido una verdad manifiesta en las ciencias sociales que el pro-
1:na \tmfi;rnra o ~umícacia ;nr undada-. con n•~p•,,ctn a d0tc:111inados di~C'ññ~. ceso mismo de medición puede hacer cambiar aquello que se

23
mide. La ganancia test-retest sería una importante consecuen- Oi), en una prueba posterior en que se adopte la misma for-
cia de ese cambio. ( Otra, la interacción entre la realización de ma de antes u otra similar a ella, casi con segurida,l 0 2 tendrá
la prueba y X, la estudiaremos rn,1s adelante, junto con el di- para ese grupo un promedio más elevado que 01. Este resul ..
seño 4. Además, es importante evitar esas reacciones al pre- tado confiable no se deberá a ningún efecto Penuino de X a
test, aun cuando surtan efectos diferentes para sujetos clistir> ningún efecto de la práctica de test y retest, ;te. Es más bien
tos.) Es de esperar el efecto reactivo siempre que el proceso un aspecto tautológico de la correlación imperfecta entre 0 1
de prueha sea en sí un estímulo al cambio, y no un mero re- y 02. Los errores de inferencia ocasionados por no haber
gistro ele comportamiento. Así, en un experimento sobre te- tomado en cuenta el .efecto de la regresión han planteado tan-
rapia para el control del peso, el pesaje i11icial puede ser ele tos problemas en la investigación educacional porque muy a
suyo un estímulo para el adelgazamiento, aun sin tratamiento menudo se desconoce su verdadera naturaleza -aun por estu-
curativo alguno. De manera similar, la ubicación ele observa- diantes que han realizado cursos avanzados de estadística mo-
dores en el aula para estudiar la capacidad prcentre11amienlo derna-. Como en exposiciones posteriores (p. ej., el diseño
del docente en el ámbito de las relaciones humanas puede mo- 1 O y el análisis ex post facto) la daremos por conocida, nos
dificar de por sí su forma ele comport:irse. La colocación de 1111 detendremos aquí a explicarla brevemente, aunque sea en
rnicnífo110 sobre el escritorio o pupitre suele variar la pauta forma m11y elemental. La figura 1 presenta algunos datos
de interacción del grupo, etc. En general, cuanto más nuevo y imaginarios en los que el pretest y el postest de una población
motivan te sea el ciernen to utilizado para las pruebas, mayor entera tienen una correlación de 0,50, sin variación en la
será su influencia. media grupal o variabilidad. ( Los datos se seleccionaron ex--
La instrumentación o «deterioro de los instrumentos» [ cf. presamente para que la colocación de las medias de fila y
Campbell, 19 57] es el término con que se designa una cuarta columna sean obvias a la simple observación visual. El valor
hipótesis rival no controlada. Esa expresión se refiere a las de 0,50 también se elige por conveniencia de exposición.) En
variaciones autónomas en el instrumento de medición que po- este caso hipotético no se ha producido ningún camoio real,
drían ser la causa de una diferencia 01 - 02. Tales cambios pero, como es corriente, los puntajes falibles del test indican
serían análogos a la mayor o menor tensión observada en el una correlación de retcst considerablemente inferior a la uni-
dinamómetro, la condensación en una cámara de niebla, etc. dad. Si, como se sugirió en el ejemplo dado antes, comenza ..
Cuando se recurre a observadores humanos a fin de obtener mos por observar solo a los escolares calificados con puntajes
01 y 02, su propio aprendizaje, tensión, etc., determinarán muy bajos en el pretcst -p. ej., 7 puntos--, y en el pos-
dikrencias de 01 0:2. Si se califican los ejercicios de re- test solo reparamos en el puntaje de esos alumnos, nos en-
dacción, ensayos o trabajos de investigación, los estándares contraremos con que los puntajes postest están dispersos, pero
aplicados variarán de 01 a 0:2 ( la técnica de control sugie- son en general mejores, y en promedio «regresionaron»
re que se mezclen los ejercicios de redacción 01 y 0 2 y se hacia la media grupal con un coeficiente de regresión o co-
los haga calificar sin tener conocimiento de cmíl ha llcrrado rrelación de 0,50, obteniendo una media de 8,5. No obstante,
primero). Si se observa la participación en el aula, ta( vez en vez de constituir una prueba de progreso, esto es una rati-
en la segunda sesión los observadores sean más h,íbiles, o más ficaci(Ín tautológica, si bien específica, de que hay una corre-
indiferentes. Si se entrevista a los padres, la familiaridad de lación imperfecta, y de cuál es su medida.
quien realiza esa labor con el programa ele entrevistas y con Cuando al trascurrir el tiempo se producen acontecimientos
determinados padres puede producir ciertos desplazamientos. entre el pretest y el postest, nos sentimos tentados a estable-
Un cambio en los observadores entre 0 1 y 0 2 también podría cer una relación causal entre dicho cambio y la acción espe•
provocar alguna diferencia. • cífica del paso del tiempo. Pero obsérvese que cabe hacer
Una quinta variable entremezclada en algunos casos del di- aquí un análisis cronológico a la inversa, comenzando, por
seño 2 es la regresión estadística. Por ejemplo, si en u.na ejemplo, con aquellos cuyo puntaje postest es 7 y observan-
prue~a correctiva se seleccionan alumnos para un experimento do la dispersión de sus puntajes pretest, de los cuales se
espec1al porque han tenido puntajes particularmente bajos en extraería la implicación inversa, a saber: que los puntajes van
el test de rendimiento escolar ( que para ellos se convierte en empeorando.

24 25
l. Regresión en la predicción de ptmtajes postest del Las inferencias causales más erróneas son las que se extraen
pretest, y viceversa. cuando la información se presenta en la forma indicada en
la figura 1 ( b) [ o la parte superior o inferior de 1 ( b) ]. Así
f__ t,·•t"1 rk• 1s1 ·-:-~rcsitn 1, se da la impresión de que los alumnos más brillantes van
<jl~; tndica, '¡; ~cjm' ' perdiendo su ventaja, y viceversa, como si fuese por el efecto
predicción de prelc-st vulgarizador y homogeneizante del medio institucional. Aun-
~ postest
Pun1;1jPs postc,as que esta errónea interpretación implica que la variabilidad po-
blacional en el postcst debería ser menor que en el pretest,
pos1esls ambas son en realidad iguales. Más todavía: si se procede al
11.5 análisis con grupos puros de puntajes postest [como en la lí-
nea de regresión e y la figura 1 (e) ] , quizá se llegue a la con-
11,0 clusión contraria. Corno lo señaló McNemar [ 1940], el uso
10,5 del análisis de control de tiempo invertido y el examen directo
!J en busca de cambios en las variabilidades poblacionales son
l() 10,0 precauciones útiles contra dicho error de interpretación.
9 9,5 Cabe observar la regresión hacia la medía en otra forma aná-
loga. Cuanto más desviado sea el puntaje, mayor será el pro-
bable error de medición. Así, en cierto sentido, el típico alum-
.z no habituado a la obtención de puntajes elevados se habrá
CY.)\,,Ó'\J)QQi,-1
.... ,_. ,_. visto favorecido por una <<suerte» extraordinaria ( gran error
V1ov.bV1ov. positivo), al paso que la mala fortuna acompañó a quien
obtuvo puntaje muy bajo (gran error negativo). La suerte
Línea de regresión e, es, sin embargo, caprichosa, por lo cual en un postest se c:s-
que indica la mejor pera que quienes poseen puntajes elevados declinen algo en
predicción de postest el promedio, así como que los de puntajes bajos mejoren su
(a) a pretest posición relativa. ( Se aplica la misma lógica si se comienza con
los puntajes de postest y se procede hacia atrás, en dirección
Predicción Ptedícción al pretest.)
De grupos A medias A medias De grupos La regresión hacia la media es un fenómeno general, que no
prercsts - postests pretests - pustests se limita a la administración del pretest y del postest con la
homo¡:téneos homog<:rK'\>S misma prueba o formas similares de ella. El director que ob-
n '-.. • 13 . /
serva que sus estudiantes de mayor CI suelen obtener pun-
tajes inferiores a los máximos ( aunque muy elevados) en las
12
11
10
-------~
.__~-~

-------
12
11
10
9
~----
1//

:-----...
pruebas de rendimiento escolar, mientras los de menor CI no
suelen ocupar el extremo inferior en esas pruebas ( aunque sí
puestos bastante bajos), sería culpable de falacia en la re-
gresión si dijese que su escuela subestimula a los alumnos más
brillantes y recarga de trabajo a los atrasados. Si seleccionase

~
9
a los que obtuvieron el mayor y el menor puntaje en la prueba
8 ~ .
~/.-----
R de rendimiento y analizara sus CI, la misma falta de lógica lo
7 / • 7
forzaría a llegar a la conclusión opuesta.
Si bien hemos hablado aquí de la regresión a propósito de los
(e)
errores de medición, en general, ella depende más bien del
(b)
grado de correlación: cuanto menor sea esta, mayor será la

26 27
r<:gresión hacia 1a media. La falta de correlación perfecta puede ',. Comparación con un grupo estático
deberse a «error» y/ o a fuentes sistemáticas de variancia es-
pecífica propia de una o de otra medición. 1,] tercer diseño preexperimental necesario para nuestra expo-
Los efectos de la regresión son, pues, acompañamientos ine- sición de los factores de invalidación es la comparación con
vitables de 1a correlación imperfecta de test-retest para grupos nn grupo estático. Es un diseño en el cual un grupo que ha
seleccionados por su ubicación extrema. No son, sin embargo, experimentado X se compara con otro que no lo ha hecho, a
concomitantes necesarios de puntajes extremos dondequiera fin de establecer el efecto de X.
que ellos se produzcan. Si un grupo seleccionado por razones
independientes resulta poseer una media extrema, hay una
menor expectación a priori ele que la media grupal regresione
en una segunda prueba, pues se ha permitido a las fuerzas
aleatorias o externas de variancia que influyan sobre los pun-
tajes iniciales en ambas direcciones. Pero no ocurre así en un Ejemplos de esta clase de investigación son: la comparación
grupo seleccionado a causa de su extremidad en una variable de sistemas escolares que requieren que los maestros tengan
falible, pues ella es artificial y dicho grupo regresionará hacia título universitario (la X) con otros que no exigen esa con-
la media de la población de donde se lo seleccionó. dición; la comparaci6n de alumnos de cursos qu~ reciben ins-
Efectos de regresión más indirectos pueden obedecer a la se- trucción en lectura veloz con otros que no la reoben; la com-
lección de sujetos con puntos extremos en mediciones diferen- paración entre quienes presenciaron determinado programa de
tes del pretest. Consideremos un caso en el cual se eligen, televisión y los que no lo hicieron, etc. En marcado contraste
para recibir adiestramiento experimental, estudiantes que «fra- con el experimento del diseño 6 «propiamente dich~»,_ que
casan» en pruebas tomadas en el aula. Como pretest, se les veremos m6s adelante, no hay en estos casos del diseno 3
administra el tipo A de un test estándar de rendimiento es- ningún medio explícito que permita asegurar que los gr_upos
colar, y como postest el tipo B de dicho test. Es probable habrían sido equivalentes de no ser por la X. La ausencia de
que la prueba tomada en clase tenga una correlación más alta un medio tal, indicada en el diagrama por las líneas punteadas
con la administración inmediata del tipo A que con la admi- que separan ambos grupos, señala el próximo factor que _re-
nistración del tipo B unos tres meses después ( si en cada se- quiere control: la selección. Si hay diferencias entre 01 y 02,
sión toda la clase ha sido objeto de la prueba). Cuanto más ello bien puede deberse al reclutamiento diferencial de las per-
elevada sea la correlación, menor será la regresión hacia la sonas que componen los grupos: estos podrían haber diferido
media. Por consiguiente, los fracasos de la clase habrán deter- aun sin la presencia de X. Como se verá más adelante en el
minado una regresión ascendente menor en el pretest que en análisis ex post facto, la equiparación fundada en caracterís-
el postest, dando una seudoganancia que podría haberse con- ticas que no sean O suele resultar ineficaz y conducir a erro~,
fundido con un conato afortunado de educación correctiva. particularmente en los casos en que las personas que c~n?~1-
[Para más detalles sobre ganancias y regresión, véase Lord, tuyen el «grupo experimental» han procurado la expos1e1on
1956; McNernar, 1958; Rulan, 1941; R. L. Thorndike, 1942.] a la X
Con ello se concluye la lista de inconvenientes del diseño 2 Una última variable entremezclada que, por ende, debe incluir-
que podemos analizar en este momento. En el cuadro 1 apa- se en esta lista es la llamada mortalidad experimental, o pro-
rece otro signo negativo bajo el título «Validez interna», co- ducción de diferencias 01 - 02 en grupos, al retirarse en
rrespondiente a un factor que no analizaremos hasta exponer mayor o menor número personas pertenecientes a ellos. Así,
el diseño 10 ( véase página 93) en la sección de diseños aunque en el diseño 3 ambos grupos habían sido algu1;1a vez
cuasiexperimentales, y dos signos negativos bajo «Validez ex- idénticos, quizá difiriesen ahora, no por haberse producido un
terna», que no explicaremos hasta haber realizado el análisis cambio en los integrantes individualmente considerados, sino
del diseño 4 ( véase página 32). más bien a causa del abandono selectivo de personas de uno
de los grupos. En el campo de la investigación educacional,
este problema suele encontrarse a menudo en los estudios so-

28 29
bre los efectos de la formación universitaria cuando se com- disefi.os expcrirnentales
paran las med)ciones ~fectuadas entre alumn~s recién ingresa-
dos ( que no nan tenido la X) y los que están a punto de
dichos
egr~sar ( qu~ Ja ~an tenido). Si esos estudios indicaran que las
muieres rec1en mgresadas son más bellas que las que están
por graduarse, recha7:arfamos de plano la consecuencia lógica
de que nuestro duro curso de capacitación menoscaba la be-
lleza femenina, y señalaríamos e_n su lugar las dificultades que
encuentra una mucl1acha agraciada para finalizar su carrera Los tres diseños fundamentales que vamos a exponer en e,ste
antes c~e contrae~ matrimonio. Este efecto se clasifica como son los recomendados en la actualidad por la litera--
m?rtalzdad experimental. ( Por supuesto, si observamos a las tura metodológica. Son también, como se verá, los m:is rcco-
nusmas muchachas cuando acahan de ingresar y cuando egre- ff,endados por nosotros, aun cuando tal respaldo esté sujeto a
san, este problema desaparece, con lo cual tenemos el dise- mu.chas resLticcioncs concretas en cuanto a la práctica habitual,
ño 2.)
y dé lugar a que aparezcan algunos signos negativos en el
cuadro 1 bajo el título Valide:;:. externa.
El diseño 4 es d más empleado de los tres; por eso, nos
permitiremos la libertad de explayarnos mucho más en su aná-
lisis, haciendo de él. el centro de convergencia de otras conside-
raciones, cuya aplicación es m,Ís general. Obsérvese que los tres
diseños se presentan en forma de comparaciones diversas de
una sola X con ninguna X. Los diseños que han recibido ma-
yor cantidad de tratamientos por parte de la corriente del ex-
pEdmcnto factorial de Fisher representan elaboraciones im-
portantes pero tangenciales respecto del hilo conductor de
esta obra, y se estudian al final del presente capítulo, a con-
tinuación del diseño 6. Ahora bien, esta perspectiva puede
servirnos para recordar aquí que comparar X con no X es un
exceso de simplificación. En realidad la comparación se esta-
blece con las actividades específicas desplegadas por el grupo
de control dnrante el período en que el grupo experimental
recibe la X. Por lo tanto, sería mejor establecerla entre X1
y Xc, o entre X1 y Xa, o entre X1 y Xz. El que la actividad
de esos grupos de control con frecuencia no esté especificada
añade un indeseable elemento de ambigüedad a la interpreta-
ción del efecto de X.
Teniendo ,en cuenta todos estos comentarios, continuaremos
en este capítulo insistiendo en la convención gráfica de no
presentar ninguna X en el grupo de control.

30 31
4. Diseño ae grupo de control pretest-postest chas supuestas utilizaciones del diseño 4 ( o 5, o 6) no
controlan la existencia de una historia intrasesional única. Si
a todos los estudiantes, elegidos al azar, que integran el grupo
Controles de validez interna experimental se los trata en una sola sesión, haciéndose lo
mismo con los controles, los únicos acontecimientos ocurridos
Algunas de las consideraciones anteriores indujeron a los in- en cada una de esas sesiones y que carecen de importancia
vestigadores psicológicos y educacionales, entre 1900 y 1920, (la broma exagerada, el incendio en la otra cuadra, los co-
a agregar al diseño 2 un grupo de control, creando el actual mentarios introductorios del experimentador, etc.) se con-
diseño ortodoxo con grupo de control. McCall [ 1923], Solo- vierten en hipótesis rivales que explican la diferencia d_e
mon [1949] y Boring [ 1954] fueron en parte los protagonis-• 01 contra 0:1- O,. Este no es un verdadero experi-
tas de esta histol'ia, y una revisión del T eachers Coltege Re- mento, aunque se lo presente como paradigma ilustrativo,
cord de aquel período implica más todavía, pues ya en 1912 como en la prueba de Solomon [ 1949] sobre la enseñanza del
se mencionaban grupos de control sin necesidad de mayores alfabeto. ( Para ser exactos, tenemos que puntualizar que So-
explicaciones [p. eí., Pearson, 1912]. Los diseños con grupos lomon lo eligió para ilustrar un aspecto diferente.) Medi-
de control así introducidos se clasifican en esta sección bajo tando sobre nuestras «mejores pr,ícticas» en relación con ese
dos encabezamientos: el presente diseño 4, en el que se em- aspecto, puede que ello carezca de importancia, pero nuestras
plean gmpos equivalentes logrados por aleatorízación, y el «mejores prácticas» consisten en presentar experimentos que
diseño 1O cuasi experimental, en el que se utilizan grupos in- con harta frecuencia son imposibles de repetir, y esa misma
tactos de comparación ya existentes, de equivalencia no ase- fuente de diferencias «significativas» pero externas bien po-
gurada. El diseño 4 adopta la forma dría ser una falla importante. Además, en los típicos experi-
mentos que describe el ]ournal of Experimental Psychology,
el control de la historia intrasesional, &e logra exponiendo a
estudiantes y animales a pruebas individuales, y sometiendo
aleatoriamente a los estudiantes y los períodos de prueba a
Como el disefio controla en forma tan nítida las siete hipótesis condiciones experimentales o de control. Obsérvese, no obs-
descritas, las presentaciones que de él se han hecho no han tante, que aun con sesiones individuales la historia puede
establecido en forma explícita las necesidades de control que escapar al control si se trabaja con todo el grupo experimental
satisfacía. En la tradición de las investigaciones del aprendi- y no con el grupo de control, etc. El diseño 4 requiere que
zaje, los efectos prácticos de la administración de pruebas pa- las sesiones experimentales y de control sean simultáneas. Si
recen ofrecer el primer reconocimiento de la necesidad de con- realizamos sesiones verdaderamente simultáneas, tienen que
tar con un grupo de control. La maduración era a menudo el emplearse distintos experimentadores, y las diferencias entre
punto crítico de los estudios experimentales en educación, así ellos acaso se conviertan en una forma de historia intrasesio-
como del problema naturaleza-cultura ( nature-nurture) en el nal que se confunda con X.
campo del desarrollo infantil. En la investigación de los cam- La solución óptima es una aleatorización de las sesiones ex-
bios actitudinales, como en los primeros estudios sobre los perimentales, aplicando las restricciones requeridas para lograr
efectos de las películas cinematográficas, la historia puede ha. una representación equilibrada de fuentes de sesgo tan pro-
ber sido la consideración primaria de necesidad. De cualquier bables como son los experimentadores, la hora, el día de la
manera, creemos conveniente analizar brevemente aquí la semana, la parte del semestre, la proximidad de los exámenes,
forma en que se controlan esos factores, así como las con- etc. El recurso habitual de trabajar con sujetos experimentales
diciones en que se lo hace. en pequeños grupos -en vez de hacerlo individualmente- es
La historia se controla en la medida en que los acontecimien- inaceptable si se prescinde de ese agrupamiento en el análisi'>
tos históricos generales que podrían haber producido una di- estadístico. ( Cf. más adelante el examen de la asignación de
ferencia del tipo 01 - 02 causarían también una diferen- grupos intactos a diversos tratamientos.) Todos los que toman
cia del tipo Os - 01. Adviértase, sin embargo, que mu- parte en la misma sesión participan de la misma historia in-

32 33
trasesional y tienen, pot' en<k, fuentes Je similitud distintas de l:~n tales casos, el grupo de control regresiona tanto como e1
X. Si tales sesiones se han asignado aJ ::,,zen·, d procedimiento -,~xperimental. Sin etnb,trgo, aun en las condiciones del di-
estadístico con:eno s;,'.d el 1::isrn.o c¡uc el que sdíalamos m:is :,elfo 4 se producen con frecuencia vados interpretativos, a
adelante para la m,ignnción Je aula:; inwctus a <liversos ü"ata- causa de los mecanismos de regresión. Un experimentador
mientos. {Para algunos estudios <Jm; comprenden la ad- puede aprovechar el grupo de control para confirmar los efec-
ministración de tcsi-s en grupos, los distintos trntarníentos tos de X sobre la .media grupal, y después abandonarlo mien-
cxpcrÍlnPntales pueden distribuirse al azé,r Jentro <le: 1.111 grupo tras cxmnina crníles han sido los suhgrupos de puntaje pretest
c:,ra a ·rnra, con10 en e1 uso de varías formas de un tei;t para del gi-upo experimental que han registrado mayores influen-
estudi,1r el efecto <lcl orden de dificultad de los ítems, En cias. Si todo el grnpo acusa una ganancia, llega a la estimu-
ralcs casos, los eleml~ntnr. {:s¡x:dfko,s ,l.:: la historia intt;w..:sio- lante conclusión artificíal de que quienes al principio estaban
nd son coFl.l!nc:; a ¡!mhos trnt:im.icntm; v no :':e convie,l':i en en e11 la posici{in m,ís haja han logrado e1 mayor adelanto, rnien-
una hipótesis rival accptahle que se 1:onf~mJa wn X cuawJo st tr~.:s qui.: lu8 que se hallaban en la más elevada quizá no han
explican las diferencias obtcn1das.) avanzado ln más mínimo. Este resultado se asegura porque, en
La 7/l(Uluración y fa aclministrar:íón rh· tesls e:i;tfo rnnt.:obdas condi,~ioncs de ganancia media de todo el grupo, el mecanismo
en el sentido de que su manifcstaci6n en los grupos cxperi-- de J:i.gn:~ión suple e;] pnntajc de ganancia para los participantes
mcntalcs y de control debería ser igual. La instrunzentacíón con puntaj(: pretesi infc1io1· a la media, y tiende a eliminarlo
se con trola con facilidad cuando se dan las condiciones para parn quienes en d pretcst tenfan puntaje elevado. ( Si en eI
d control de historia intrasesional, en particular cmmdo se conjunto no hubo ningún avance, el experimentador quizá
logra la O por medio de reacciones de los estud.iantes ,i. un \<descubrn1> por error que aqueilo se debió a dos efectos mu-
instrumento fijo, como una prueba impresa. Sin embargo, tuarm:ntc excluyentes: el avance de los bajos y el retroceso de
cuando se recurre a observadores o entrevistadores, el proble. les altos. i t.:n modo de evitar esos errores de interpretación es
ma es ya más grave. Si el número de observadotes es sufidcn- hacer :111álisis paralelos de aquellos gne en el grupo de control
re:mente pequeño para que su asignación a 1a observación de pkocnta11 puntajes pretcst extremos, y fundar las interpreta-
sesiones individuales no sea aleatoria, no solo habrá que em- cio1tcs <le ganancias diferenciales en comparaciones de los pun-
plear cada observador tanto para las sesiones experimentales tajes postcst de los correspondientes subgrupos experimenta-
como para fas de cor:trol, sino que además los observadores les y de control en d postest. (Nótese, sin embargo, que a
9eberán ignorar cuáles son los estudiantes que reciben cad;~ uno cau:;a de fas distribuciones asimétricas resultantes de la selec-
de los distlntos tratamientos, a fin de que el conocimiento de ción n:sulta Jmíosa la conveniencia de las estadísticas de cur-
ese hecho no sesgue sus puntajes o registros. Tales tendencias va normal.)
al sesgo son causas «confiables» de variancias, como' lo éon-• Se elimina la selección como explicación de la diferencia en
foma 1a necesidad de contar en las investigaciones médica:; la medida en que la aleatorización haya asegurado la igualdad
con ~n segi.:ndo ciego en la prueba de dos ciegos, y también grupal en el momento R, medida que queda determinada por
estudios ::ec!ent_es [Rosenthal, 1959] y anteriores [p. ej., Ken- nuestra estadística de muestreo. Así, la garantía de igualdad
nedy y Uphoff, 1939; Stanton y Baker, 1942]. El uso de es mayor para grandes que para pequeñas cantidades de asig-
registros de la interacción grupal, a fin de que los jueces pue- naciones aleatorias. Este supuesto fallará en ocasiones en el
~an evaluar una serie de se~ciones aleatorizadas de trascrip- grado sugerido por el término de error para la hipótesis de no
c10ne~ pretest, postest, experimentales y del grupo de control, diferencia. En el diseño 4, ello significa que a veces habrá
contribuye al perfecto control de la instmmentaci6n en las una aparente diferencia «significativa» entre los puntajes pre-
investigaciones sobre In conducta escolar y la interacción test. Por lo tanto, aunque la aleatorización simple o estratifi..
grupal. cada asegura la asignación no sesgada a los grupos de sujetos
La regresión se controla, en lo que a las diferencias de medias experimentales, constituye un medio muy imperfecto para ga-
concierne y por muy extremo que sea el grupo en los puntajes rantizar la equivalencia inicial de dichos grupos. No obstante,
pretest, si tanto el grupo experimen :al como el de control se es la única forma práctica de hacerlo. Lo decimos así, tan
asignan al azar, tomándolos de este J1ismo conjunto extremo. categóricamente, a causa de u.na muy difundida y errónea pre-

34 35
dilección, evidenciada en la investigación educacional durante innegable que este procedimiento atenúa el efecto aparente (!e
los últimos treinta años, por la igualación mediante la equi- X pero evita el sesgo de muestreo, fundándose en el previo
paración. McCall [ 1923 l y Peters v Van Voorhis [1940] ,;dpi:iesto de que no había sesgos de mortalidad más simples.
contribuyen a perpetuar este equív¿co. Corno veremos con Este supuesto es susceptible de verificación parcial examinan-
mayor detalle al estudiar el diseño 10 y el ex po.st facto, la do tanto el número como los puntajes pretest de quienes
equiparación no constituye una ayuda re'11 cuando se la utiliza participaron en el prctest pero no en el postest. Es posible
para solucionar diferencias iniciales de grupos. Ello no signi- que algunas X influyeran en esa tasa de abandono, en vez de
fica que propugnemos l:1 eliminación lisa y llana de este pro- modificar los punlajes inJividualcs. Por supuesto, aun cuando
cedimiento corno posible nditamento a fa ,1leatorízación, como tales t,isas sean las mismas, queda todavía en pie la posibi-
ca.ando se obtiene mayor precisión estadística asignando estu- lidad de que se produ·,:can complicadas interacciones que
diantes a pares equip«rados y asignando después al azar un propenderfon a diferenciar el cm·,icter de los abandonos en los
miembro de cada par al grupo experimental y otro al Je con-• grupos experimentales y de control.
trol. En la liter;1tura sohrc estadística, esto se designa con el El problema de la mortalidad. puede obs~rvarse con .toda ~la-
t<:rmino «hlm¡uc()». Véanse, en particulnr, los estudios de Cox ridad en el estudio de métodos correctivos con votuntrmos.
[_l,957], fcldt [1958] y Linck¡uíst [ l 953]. Pero la equipara- Así, por ejemplo, se invita a un grupo de lectores deficie1:ites
~1un cor1_10 :il(Stl~lltO d~ la alcatorización es tnbú incluso par,1 de una escuela secundaria a participar en sesiones correctivas
los d1scnus cu.is1exper1mentalcs que no emplean más que dos voluntarias mientrns que otro grupo en las mísmas condíciones
grupos natnrnles intactos, uno experimental y otro de control: no es invitado. Del primero de ellos, quizá participen en las se-
aun en e:-;c endeble «experimento» hay medios mejores que la siones un 30 CJ6 de sus integrantes. Los puntajes post:ests, así
armonización para tratar de corregir diferencias iniciales· entre como los prctest, provienen de pruebas de lectura estándar ad-
las medías de una y otra muestra. • ministradas a todos los que asistían a clase. No es razonable
Los elatos de que disponemos gracias al diseño 4 permiten es- comparar el 30 % de voluntarios con el total del grupo de con-
tablecer qué mortalidad explica aceptablemente la ganancia trol, porque representan a los má? preocupados por, sus punta-
01 - O:2. Mortalidad, casos perdidos y casos para los cuales jes pretest, los capaces de trabaJa! con. mayor 1~h1nco en su
solo se dispone de datos parciales, son difíciles ele manejar propio mejoramiento, etc.; pero es 1mpos1ble locahz11r sus exac-
y por lo común se los trata de disimular. La experimentación tos equivalentes en el grupo de control. .Aunque tampoco pa-
típica con métodos educativos se prolonga durante días, se- rece justo para la hipótesis de eficacia terapét~tic~ comp'1rar el
manas o meses. Si se rcalizm los pretests y postests en las total Jel grupo invitado con el total del no invitado, es esta
aulas de Lis que se toman el grupo experimental y el grupo de una solución aceptable, si. bien moderada. Nótese, empe~o, 9-~e
control, y la condición experimental requiere la concuri-encia puede ocurrir que lo que produce. e11 efecto sea la rnvttac1on
a determinadas sesiones sin que ocurra lo mismo con la con- misma, y no precisamente ,Ia terapia: En genera_!, ~l grupo de
dición de control, la distinta concurrencia a las tres sesione<; control no invitado deberta poseer igual conocumento de su
( pretest, tratamiento y pos test) produce una «mortalidad» posición en el pretest que el g~upo in':itado. Otra posibilid~d
que puede introducir en la muestra sutiles sesgos. Si de todos es invitar a todos los que necesitan sesiones correctivas y as1g
los designados en un primer momento como participantes del nar los voluntarios a grupos de tratamiento verdaderos y f_al-
grupo experimental eliminamos a los que no concurren a las sos· mas en el estado tictual del arte es probable que cu~1lqu1er
s~siones de prueba, re?ucimos selectivamente el grupo expe- ter~pia suficientemente bien presentada como para qne pa~ezca
rimental con un mecamsmo que no se aplica en forma similar una ayuda al estudiante sea tan eficaz como el tratamiento
al grupo de control, sesgando al primero en el sentido de los mismo que se estudia. Cabe, no obstante, destacar la conse-
responsables y sanos. El modo preferido de tratamiento aun- cuencia innegable de que las pruebas experimentales de la
que no de utilización habitual, parece ser el empleo de 'todos eficacia relativa de dos procedimientos terapéuticos son mu-
los estudiantes seleccionados, experimentales y de control, gue cho más fáciles ele evaluar que la eficacia absoluta de cual-
completaron tanto el pretest como el postest, incluso los inte- quiera de ellos. La única solución utilizada en la práctica es
grantes del grupo "'xoerimental que no obtuvieron la X. Es crear grupos experimentales y de control entre quienes desean

36 37
,,•3;:;m-::ienLo (:or1Tcílvo, mani¡,ulando los períodos de espera [p . joJ e~: /jisciios ,.~xperimenta les rc~;ul LJ así atractiva a qu.ien tiene
:::i ,, Ro;1,ers y üyrnond, .! ~}'¡;,t 1, "Fstn, por supuesto,, su!iciti1 a c;1uc apltcar1os:, pues piensa cun ~-odn razón. que se la~; ha sos-
veces oLfas d;ficultades, ulmD CI excl'.sÍvo abandono por parte Lr,'ndo sin rnol ivo en el tr:1tarnícnto formd cornún sobre rm:tc
óel f;rlljl'l de: ccn,.ri,1 con tcr.1pia prn;pucsu:. Una aplicación d1;lo,\í:1 c;,rpcrimcnlal. El análisis ~;iguicnte ratificmá tale,; apr(c
{cliz y :,l p::íTcer no reactiva de un mcrn1ús1no de lolcrfa para c):1cinnc~: ::;ch::dando xnu1tlrud de Jncdio~:; tpJe sin pcrdc~r va1.idcz
1

dn:idir ~;ohc !u a¡,l.iuwíó11 inn1cdinta o diferida,. drnrante un puukn dar rrn;yor valide::, cxlerna a los ,~x\wrÍlm.:DUis
c:(:·nw::I, f'., de 1m cur:-,o corrcclivo (le lccí ura puc·de verse en ha:.;c:.; ruás firn1c~; (k· g-.::J1c:ra!iz~1ción ~1 ia prácl k·n. docente.
-:(u,d Jt9)6]. au les tk· cntrat cu ~:;~e i:crnn. fl(JS es ü1cviü,dJlc hacer 1.1n21
~·dvcrtci1ci;1 que introduce: en L1 ciencia de kl inducci6.n un . . )s
c1.1cu1to~~ pnd)lcrnas csplno::·¡os, a can~-;a <..le 1a fK'l'~,isLc=-~tri.e rcsi.:-.;
1cJ¡cÍ~1 :l ~1ccpt:1r- lo que cun tuda vcrcLvJ dice l ·!u.ntc} a sah{.::r:
le:: indncriá;z o uencral.i.r(ü:ÍÓn 1!lif?Ca tiene z:.1lr.r j:li,.:'ift just.i.•
Lo:s fncrorcs de invalide?: cxienrn dcsnitos hm;ta nhorn Úan lrí.r'.ira. J\ 1 j;a,;o qtw lo:; prol>lcm:1s de 1dc'c: i11/erw1
:·i1:.U lo, que dircct'.nncnte inlh1°lnn :;oh1T los puntajcs U, y que :un s11sccptiblcs de solución duitro de lo,; Hrníic:; de I:\ V,;-,i(':
por :;( :mios podían pr.odm:ir Gu-11,im; suscq,tihics de confun. ik la c.,1adís1ica probabilísiica, los de v:ih.kz c.:zkrn:1 u.o pu,':·
dirsc ('On bs rc:mltado,i. de X, es decir, foc1orcs que, 1.,11;1 vez dt·11 rcso1vctsc en estricto rigor lógico en nna fnrn.ta üftidr1 }'
agrcg:tdl) ci grupo de corrirol, producirian dcctos evidentes roncluycnlc, Generalizar significa siempre mc:;,dat b cxt.n;po
en este y que se sumarfan a los de X en el grupo expcri- bci6n en un cambio no J'eprcsc11í::1do en rn1cstrn (!JliCSlT,L Di
HH:nlaL En d lenguaje propio del análisis de variancias , ha cxtraplifaci<Ín se hace suponiendo que se conocr.:i' Lrn leyes
-....historia, m,1'duración, rea[iza'Ción de pmchas, etc. . se i',:spcctivas. Así, :;i tenernos un discíío 11 Ínicnrnniclli'c v:ílido,
/rn; corn;idcró efectos principales, y como taks se lo:; ha con.. d dccto queda demostrado solo a propósito de bs ronciicío•
üoirndo en d diseñe, 4, dándole validez interna. Las mnenaz:as m:" específicas que d grupo experimental y d de con ,rol tie •
a b validez externa, por otra parte, pueden considerarse efec- nen t.:u cornún, es decir, solo en rel:wión con gn1r1us somc<:idos
tos ék interacción entre X y alguna otra variable. Constituyen, ;1 pre test, pero de determinada ecLid, intcligcncin, s.i l::mc:íón

pm:1,, 1ma posible especificidad de los efectos de X respecto :;nciueconómica, región geográfica, momento hi:,t:6dco, coujun·
de algún conjunto de condiciones inconvenientemente Hmita- ción csLcbr, orientación del cam:Jo magné1ico, presión bato•
1las, Corno anticipo diremos que, hasta donde nosotros sabe- 111<:t rica, nivel de rndiacío1ics g;1m1na, ctci;lera
mos, en el diseño 4 los efectos observados de X pueden ser Desde el punto de vista lóg)co no podernos gcner2,lízar más
espedficos de grnpos cuyo interés fue intensificado por d ,,11:í de dichos límites; es dcór que ne; podemos generalizar
pretest. Corno es natural, no podemos extender nuestras con- er1 modo alguno . Pero tratamos de haced.o conjeturando leyes
clusiones al conjunto mayor no sometido a prctest, ,1cerca del y verificando algunas de díchas generalizaciones en otras c011••
crnd desearíamos extraer conclusiones, diciones no menos específicas pero diferente3, A Jo largo <le
En este capítulo cxnminaremos unas cu::mtas de esas amenazas la l1isloria cfo cada una de las ciencias, se aprende-11 «justifirnr»
a la posibilidad de generalización, así como los procedimientos Lis generalizaciones propias de ella a causa de la acumulación
parn sortearías. Es decir que se prefieren estos diseños por ra- misma de fa experiencia en hacerlo, pero no es esa una gene-
iones de validez externa o posibilidad de generalización, dado ralización lógica, deducible de los resultados del experimento
que hay diseños válidos que evitan el pretest y en muchas miginaL En esa situación hacemos, al generali:,;ar, suposiciones
situaciones ( aunque no necesariamente en la investigación edu- sobre leyes aún no demostradas, incluyendo algunas que ni si••
cacional) se desea generalizar precisamente con respecto a los quiera se indagaron, Así, en la investigación educacional, su-
grupos no sometidos a pretest, En el campo de la docencia ponemos por lo común que la orientación del campo magné•
constituyen juicios acerca de la validez externa las dudas que tirn no la afecta, Pero sabemos de ciertos estudios que con
con frecuencia se expresan sobre la aplicabilidad práctica de frecuencia el pretest ha tenido un efecto, y por lo tanto quisié-
los resultados de ciertos experimentos muy artificiales. La in- rnmos eliminarlo como obstáculo para nuestra generalización,
troducción de tales consideraciones en el análisis de los me- Si hiciéramos una investigación sobre barras de hierro, sabría-

38 39
mos por la experiencia que una primera pesada nunca produ- tes a algunos experimentadores a la aplicación del diseño 6,
c_e efe~tos reactivos, pero que la orientación del campo magné- que omite el pretest. En especial durante los estudios de cam-
tico, s1 no se la regulara de manera sistemática, podría limitar bios de actitud, en que los mismos tests introducen grandes
gravemente la posibilidad de generalizar nuestros descubri- ecmtidades de contenido extraordinario (p. ej., una tan abun-
mientos. Los motivos, pues, de invalidación externa son pre- dante dosis de cleclaraciones hostiles como las que se hallan
sunciones de leyes generales en la ciencia de una ciencia: con- en el test típico de prejuicios), es bastante probable que las
jeturas acerca de los factores qne pueden intetactuar con nues- actitudes de la ¡x'.rsona y su propensión a dejarse persuadir
tras vnriahlcs de tratamiento según cierta ley, y, por lo tanto, varíen por influjo del pretest. Como psicólogos, dudamos se-
,1cerrn de los que pueden dejarse de lado. riamente de la comparabilidad del público que asiste a una
Ade1pás de los elementos, específicos existe una ley general proyección de Gentlcrneu's Agreement ( un film antiprejuicial)
empirtca que nosotros, :JSI como el resto de los hombres de inmediatamente después ele habérsele administrado un test de
ciencia, aceptamos como ;,upucsto: es la versión moderna de l 00 Ílcms sohre imtisemitisrno, con otro público que vea la
.la hipótesis de Mill acerca de la <<legalidad» de la naturaleza. misma película sin que se lo haya sometido precisamente a
Esa versión, menos tajante y drástica, puede enunciarse co- dícho ll'st. Estas dudas se extienden no solo al efecto princi-
mo el supuesto del «aglutinarniento» ( stickiness) de la natu~ p:11 del pretest, sino tarr.bién a su cfecto sobre la respuesta a
ralez,1: cuanto más cercanos se hallan dos acontecimientos en Li persuasión. Supongamos que esa película en particular fue
tiempo, espacio y valor -medido este en cualquiera de sus tan hien re,1lizada que algunas personas llegaron a disfrutarla
dimensiones o en todas ellas-, más tienden a ajustarse a las por su interés romántico, sin darse cuenta siquiera del proble-
mismas leyes. Si bien las interacciones complejas v las relacio- nrn social que planteaba. Tales personas no existirfan proba-
nes curvilíneas habrán de confundir presumiblemente los in- lilemente en un grupo al gue se hubiere administrado un pre-
tentos de generalización, tal posibilidad aumenta en relación icst. Sí el pretest sensibilizó al público sobre el problema,
di.recta con el grado en que la situación experimental difiere podría, por medio de una concentración de la atención, inten-
de la si tu ación con respecto a la cual se desea generalizar. sificar en sí el efecto educativo de X. Sería concebible que
Nuestra necesidad de una mayor validez externa será pues, el i.::sn X solo resultase eficaz para un grupo al que se hubiese
requerimiento de la máxima similitud entre experi~entos y administrado un pretest.
conclíciones de aplicación que sea compatible con la valiaez Aunque es frecuente mencionar un efecto sensibilizador de esta
interna. índole en comentarios anecdóticos sobre el tema, los pocos
Téngase en cuenta, en este sentido, que las ciencias más resultados publicados de investigaciones indican tanto la ausen-
«prósperas», como la física y la química, han avanzado sin cia de efectos í p. ej., Anderson, 1959; Duncan y otros, 1957;
prestnr la menor atención a Ja represent:atividad ( aunque sí, y Glock, 1958; Lana, 1959a, 1959b; Lana y King, 1960; Piers,
muc~a, a la reiterabilidad por parte de investigadores indé- 1955; Sobol, 1959; Zeisel, 1947] como un efecto de interac-
pend1entes). Un laboratorio artificial dentro de una torre de ción que equivale a un amortiguador. Así, Solomon [ 1949]
marfil quizá sea una maravilla, pero no será representativo, y descubrió que administrando un pretest se reducía la eficacia
a menudo la artificialidad puede resultar imprescindible si se del entrenamiento ortográfico experimental, y Hovland, Lums-
quiere s.ep?rar analíticamente variables fundamentales para Jos daine y Sheffield [ 1949] sugirieron que un pretest restringía
descubrimientos de muchas ciencias. Pero, sin duda, si no in- los efectos persuasivos de las películas cinematográficas. Bien
terfiere con la validez interna o el análisis, la validez externa vale la pena evitar este efecto de interacción aunque no sea
es un~ co~sider?ción de la mayor importancia, sobre todo pªra tan expuesto a error como la sensibilización ( ya que los falsos
una ciencia aplicada como es la pedagogía. positivos son un problema mayor en nuestra literatura que los
falsos negativos, a causa de la gran cantidad de descubrimien-
Interacción de las pruebas y X. En estudios del diseño experi- tos publicados [Campbell, 1959, págs. 168-70]).
mental en sí, el peligro que constituye el pretest para la vali- Al restringir la validez externa, el efecto del pretest sobre X
de7, externa fue denunciado por primera vez por Solomon depende, naturalmente, del grado en que tales mediciones
[ 1949], aunque idénticas consideraciones habían llevado an- repetidas son características del conjunto respecto del cual se

40 41
quiere genernlizar. En el ámbito de las conmnintdones masi- por realizar un estudio dentro de una única escuela volunta-
,,as, la entrevista del investigador y los proccdirnicnto:; del test ria, empleando la asignación aleatoria de sutetos a grupos ~x-
de actitud son bastante atípicus. Pero en la investigación pc- perimentales y de control, no nos preocupana el «efecto prm-
,l,!grígica nos íntu,·sa gcner"a!i%ar respecto de nna situación en
¡1ue b admínistniciún ,.k tests es una práctica regular. Sobre
cipal» de la escuela en sí. Si este factor elevara por igual !ª
media del grupo experimental y la del de control, no se caus?r1a
t:~ido si el cxperim.cnto puede utilizar como O exámenes co•· daño alguno. Pero si existiesen en la escuel~ características
l'l'icntcs tornados en 1as aulas, pero quizá también si las O que hicieran más eficaz al tratamiento e~perimental en ella
i.:xpcriment:11(::; ,on simihm:s a 'las de utiliz,i.1.::i<in hahitual, nn
que en la población de escuelas que constituyen el verdadero
se nroducirfa t\Í1w1J1H1 inrcracd6n in,kscahJc entre la rulminis objetivo de la prueba, las consecuencias podrían ser graves.
l?'a~·ión de los ic!>-'t.1· y X. Cu.ando se emplea nn test con procc Queremos estar seguros de que puede menospreciarse la in-
dimicntos muy poco usuales, o cua11clo el test implica engafo.),, teracción entre las características de la escuela ( probablemente
i:ec:strnctumólín conceptual o cognitiva, sorpresa, tensión, cte., relacionadas con el hecho de que es voluntaria) y los trata-
los diseños con grupos no son1etidos a prctcst contimían sien-- micn tos experimentales aplicados. Algunas variables experi-
do muy convenientes, aunque no ÍlDprcscindiblcs. mentales podrían ser bastante sensibles a las características de
la escuela, lo cual quiere decir que interactuarfan con ellas;
Interacción entre la selección 'V X. f\un cunndo el discíío 4 otras, no. La interacción podría darse en escu~las co_n CI
controla 1os efectos de selección a fin de explicar hs diferen- medios similares, o no presentarse allí donde las d1ferencrns de
cia:-; entre el grupo experimental y el de control, continúa en CI fuesen elevadas. Sería de esperar, sin embargo, una mayor
pie la posibilidad de que los efectos váliJamcnlc dcmnstrmfos probabilidad de interacción si las escuelas difiriesen mucho en
solo se verifiquen en aquella población aislada ele la cual se distintas características que si fuesen análogas.
extrajeron a la vez ambos grupos. Esta posibilidad es tanto A menudo se producen importantes sesgos de muestreo a cau-
mayor cu.anto miís graves son nuestras dificultades de conse- sa de la inercia de los experimentadores, que no conceden a
guir sujetos para el experimento. Consideremos las posibles una selección más representativa de escuelas la opor~unidad
consecuencias de un experimento de enseñanza en el cual el de negarse a participar. De ahí que la mayoría d~ l_as mvestt-
investigador se ha visto rechazado por nueve sistemas escolares gaciones sobre educación se ~agan en los est~~lec11n1entos que
y ,1ccptado por el décimo. Es casi seguro que ese último dife-
cuentan con mayor porcentaJe de alumnos htJos de profesores
ría, en más de un aspecto, de los nueve anteriores, así como universitarios. Aunque es imposible la representatívidad per•
del conjunto de escuelas para el que quisiéramos generalizar. fecta en el muestreo, y aun se la descuida casi en absoluto _en
Por lo t;111 to, no es representa tívo. Podría asegurarse que, e11 muchas ciencias ( por ejemplo, en la mayoría de los estudios
cuanto a la escuela media, su personal tiene más espíritu, me- publicados en el Journal of Experimenfal r:_sychology) '. pued~
nos temor a .las inspecciones y más deseo de mejorar. Y aun- y debe aspirarse a ella como a un des1deratum en la m~estl-
que los efectos que descubriéramos fuesen internamente váli- gación educacional. Una forma de aumentarla es reducrr el
dos, podrían ser específicos de tales escueJas. A fin de poder número de alumnos o aulas participantes que pertenezcan a
formular un juicio lo más exacto posible sobre LI materia, con- un coleaio o nivel dado y aumentar la cantidad de escuelas Y
vendrá que los informes de investigación proporcionen d:1- niveles ~n que se lleve a cabo el experimento. Es obvio que
tos sobre cuántas y cómo eran las escuelas y los cursos de los nunca vamos a realizar experimentos sobre muestras qu.e re-
que se solicitó cooperación y la negaron, a fin de que el lector presenten a todas las aulas de Estados Unidos o del mundo.
pueda estimar la gravedad de posibles sesgos selectivos. En
Solo poco a poco. a.prende;emos hasta dón~e se puede g~nera-
general, cuanto mayor es la cooperación prestada, mayor el Iizar un descubt1m1ento mternamente válido, por medio de
grado en que se afecte la rutina y más elevada nuestra tasa de comprobaciones empíricas en ese sentido. Pero t_ales intentos
negativas, mayor será también la oportunidad de que exista de generalización tendrán éxito más ,a menudo st en el _expe-
un efecto de especificidad de selección.
rimento original se demuestra el fenomeno en una amplia va-
Aclaremos más puntualmente qué es lo que en realidad sig- riedad de condiciones.
nifica la «interaccíón entre selección y X». Si estuviésemos En cuanto a los signos positivos y negativos que aparecen en

42
43
el cuadro J., resulta evidente que nada seguro puede consignar- otras ciencias el s11puesto empírico de que no existen leyes
se en cs:1 culumti:t. Se la prcscnt:1, no nhsL1n1c, porque los re qtK' (kpcnd:rn en \'Ctdad ckl tiernpo, que los_ dccl ()S de b
quísitos de algunos diseííns exageran o atenúan la gravedad historia, cuando les haya, se deberán a combmaoones espe-
de este problcm,1 El diseño 4, dentro dd rimbíto de las acti- cíficas de condiciones de estímulo que se dieron en aquel mo-
tl!Cles es un en 1o que a conpcr:1ei6n por mento, v que llepdn :i incorpornrsc en definitiva a leyes ge-
p:1u.c de lus particip,u1les se refiere, que c11 ddinitiv:1 la invcs-- nerales independientes del ti,:mpo íNeyman, 1')601- (T:1! \'CZ
tigación solo se h,1cc con un público cautivo en vez de reatÍ- parezca que las cosmologías de un .«uni:7<_:rso en expansión»
:;,:arla con cindadanos comunes, que son a quienes quisiérnmos requieren una resrricción de esta afirmac10n, pero no en for-
rc:Lrírno:-,_ 1•:n 1.nu sít11:1ci,;n de v--a índole·, el diseno .¡ mere- rn:1s l"'.r!Íncntcs \l lu que ,1hora cst11clia_nios. ). Sin 't'.lllhlrg.n,_b
cería un signo negativo en cuanto a selección. No obstm1tc, feliz reiteración de los resultados de la mvest1gac10n en d1stm-
en la investigación pedap,ógica nuestro unÍ\-crso de interés está to'; tiempos y sítnaciones aumenta nuestra co'.1fianzn en ~l valor
, unstiluidn por un público c:iutivo ¡int:1 el nial se ¡,11,cdcn ,)htc- b gencraliz:tc(Ón, al dismirrnír la prob:1h111dad de la m1t:r;1c-
ncr disc11us 4 Jc.: ckvad;i rcpre;;;enLativú.bd. cíón con h historia.
Estos distintos factores no se han incluido como otros tantos
Otms inh r,1cci011c1 can X. De manera parecida, las intemccio-
0
cnc,1hez:nníentos ch· columnas en el ci.rndro l, porque no ofre-
tws (k X con ], ,,: dc·rn:í-, fact()rcs pucdn1 cx:unm:\fsc n,rno C<.'tl hist·s fini¡es de cliscriminacití11 e!:trc difcrentc·s disefü 1s,
amenazas a b v:1lidez externa, La morLalicl11d diferencial sería
un prodncto de X v no una interacción con ella. L1 interaccit'ín DistJositfros reactivos. En d experimento psicolófico común,
de h í11stníl!li'JJ/,1, i1;11 con )( se h,1 incl11idn implícit,11ncntc en < 1; 0 en b invcsti:';\CÍ(Ín nlm::llÍ\':1, b ohvía ,irtí!icialidad de
el análisis de validez interna, ya que un efecto e,pedfico de fo situación expcri1~1entaJ V fo conciencia Jel estudia~te Je
instrumentación ante la presencia de X falsearía el verdadero que está participando en un expenme_n~o son caus:1s _mas que
efecto de X (11. ej .. nundo los ohscrv:1dnrcs asignan pnnt.ijcs, s11ficic11lc:; (le Cll"lTICÍa <k r(·prc:;cntcltlvtcL1d. Para su¡ctos hu•
rnnocen Lis ltip,ótc.:sis y sah.:n cu:ilcs son los estudiantes que nunos, se proyccla una tc11_-ea de r6o~uci6n de pruhlemas d.t.:
recibiewn X). lJna amenaza a la validez externa es la pcsi- orden más elevado. en la nrnl se reacciona contra los procul1-
liilidad de que los efectos sean específicos de los instrumentos ~1icntos v el traLl~1iento experimental no solo en razón de
¡ ,;1r1 ic11Lm·., ( tcsl ,. ohscr, :](lores, inl'didor"s, etc. l cmple,Hlus :; 1 1s simples v,i!or:") de estírnu.lo, sino t:irnhíén por su f1rnci(,n
en el estudio. Si cn todos los tratamientos se utilizan obser- de claves para interpretar la intención del experimentador.
v.idores o entrcvístadore,; múltiples, tales interacciones plle- El representar cargos, el adivinar la intención, el prepat:1rse
drn c·st11cLH:;c <lin:cL1rnc11tc !Stanlcy, J ')(,1a]. La rcgrcsitín n, 1r: 1 1;1 , el Sl'lltir c:1,b n1:1l qL·,:- ,,soy un cone;i1k,
no i11tcr:1ccíona cun X. ~le Indias», o mnchas otras actitudes así generadas, no son
La maduri!ción tiene consccuenci,1s de especificidad de selcc- en modo alguno representativas de la ,verdadera , sitl~aciún
cí<ín: los resulr:idos pueden ser específicos de un determí- cscohr· r,arrccn c1lificar más bien el etecto de X, d1frcul-
rudo gr:q,o ctari,i, del c:msancíc,, etc, Lt intei-;t,Ti,ín de Lt t:1mlu ~r:1vem,·ntc Li gc1wr,1lizaci611. C:tiandn es i1np,1sibk l'\'l-
historia y X implicaría que el efecto había sido específico de LF tal~s disposithos reactivos, hJbría que continuar de cual-
hs condiciones históricas del experimento, y aunque su ob- quier manera con los experimentos de esa ín~lole_ que tei:gan
,,, rv:1ci(ln es v(ilid:1, 110 se lo hallaría en 01 ras. V,l Iidcz j ;-, 1crn:1, p~·ro res u 11 a obvi:1 la con\·cntencu de ,:v I t:ir-
Fl hecho de que el experímentn se llevase a cabo en el los cuando ello sc:1 posible. Al hacer esta afirmación adheri-
trascurso de una guerra, o a continuación de haber fracasado mos en parte a la conocida crítica antiexperimental que es
una hucl:,_:1 de nu(_'strns, etc., podría pr(\d11ci1· nna reacción lr,-cu.c11k cr1 los consejos de ed11c:1ción y entre los docentes,
fr,:nte a X que Jh) aparLü.T.Ía cu ull:as círcunstnncias. Si tu- contra b dutilidad» de ,<toda esa expcrirnent<tcitÍrn:,. :Nfte,tra
viésemos qL1e preparar un modelo de muestreo para este pro- rn:'Ís moderada conclusión no es, sín embargo, que habría que
blcm;i, nos gustaría que el experimento se repitiese en una :1bandonar la investigación por ese motivo, sino más bien
n1uestra ,1lc,1toti:1 de oc:1,ium·s pret(ritas v hitun1s, lo cua1, q11c, a c:1us,1 de él, habrL-i que f]1('.j,1rnrla. J\ este re';pectn te:·1e-
como es obvio, resulta lmposihle. Además, compartimos con mos unas cuantas sugerencias que ofrecer.

-i 5
Cualquier aspecto del procedimiento experimental puede pro- de gr:11cnd izarse ¡i otras situaciones
ducir ese resultado de dispositivos reactivos. La administración
de pretests, prescindiendo de su contenido, puede hacerlo, y c:,;tm· en boga dos tipos pri.ncipa-
parte de la interacción del pretest con X puede ser de ese denlro de las escuelas: 1) estudios
tipo, aunque hay poderosas razones para sospechar de los as- a la (:scuda por :,dgujcn de fuera, que persigne
pectos mismos de contenido de la aplicación del test. El sis- i11tcrc:;(:':i y cu.yo objetivo no es que la escuela em-
tema de aleatorización y asignación a tratamientos quizá sea irench un:1 :i~'Cié,n inmediata ( o cambio), y 2) d llamado
de esa índole. Consideremos el efecto que se produce sobre ,nves1 ig,Hlol' <,de acción», qrn' procura qiw semi los maestros
una clase cuando ( como en Solomon [ 1949] se hace pasar 111isinos quic1H:s <<Cxpcri111cn!cn», tomado este t,:rn1ino en sen-
a una habitación separada a la mitad de los alumnos, elegi- Lido muy a111plio. ·En d prin1cr rnso los Lados pueden
dos al azar. Ese acto, más la presencia de «maestros» extra- ·ser rigurosos pero no aplicahlcs. En el segundo, en cambio,
ños, tiene qne crear por fuerza expectaciones de hechos sc,111 rnuy aplicables pero probablemcnt¡: no son «cier-
desusados, suscitándose así el asombro y una activa curiosi- ;us», a causa ele una gran foltn de'. rigor en la invcsl:igaci6n.
dad en cuanto a su objeto y finalidad. La presentación del ro modelo posible es que las ideas p:,1rn la invcst.igación CS··
tratamiento X, si fuese un acontecimiento inusitado, podría , obr partan de los maestros y directores, se elaboren los
tener un efecto similar. Es de presumir que aun el postest, en diseflos para someterlas a prueba en coopc~ración con espe-
un diseño 6 de postest solamente, podría crear esas mismas cialistas en metodología de investig:ición y luego se encar-
actitudes. Cuanto más evidente sea la conexión entre el tra- guen de la mayor parte de la cxperimentacicín los promo.-
tamiento experimental y el contenido postest, más probable tores de la idea. Los análisis estadísticos respectivos podría
será ese efecto. re:ilizarlos el investigador mctodologista, y los resultados los
En d campo de los cambios de opinión pública, esos disposi- n,l,,erfa a introducir al grn po un intermediario idóneo ( su-
tivos reactivos suelen ser difíciles de evitar. Pero en la mayor pervisor, director de investigaciones del consejo escolar, etc.)
parte de la investigación de métodos educativos no hay nece- que hubiera servido en tal carácter durante todo el proceso.
sidad de que los estudiantes sepan que se está realizando un De esa manera se lograrían tesnlt:1dos pertinentes y <,corree--
experimento. ( Sería muy conveniente que también los maes- tos>>. La forma de realizar investigación básica con un siste-
tros lo ignorasen, a la manera del doble ciego en medicina, ma de esta índole es un problema en gran parte sin resolver
pero por lo común esto suele ser imposible.) Varios recursos 11ún, pero los estudios podrían ser cada vez menos ad hoc y
permiten disimularlo. Si las X son variables sobre aconteci- orientarse más hacia los aspectos teóricos, bajo la supervisión
mientos usuales en el aula, pero que se producen a intervalos de un intermediario competente.
bastante largos dentro del calendario escolar, un tercio de la Aunque no tenemos en esta obra la intención de destarnr
batalla se habrá ganado si los tratamientos mencionados se los buenos o malos ejemplos observables en la literatura es-
aplican sin previo anuncio. En forma similar, si se incluyen pecializada, un reciente estudio de Page [ 1958] indica una
las O en exámenes regulares, se llena el segundo requisito. utilización tan buena de estos aspectos ( evitando dispositivos
Si las X son comunicaciones centradas en determinados estu- reactivos, logrando representatividad de muestreo y evitanJo
diantes, puede lograrse la aleatorización sin necesidad de tras- las interacciones entre las pruebas y X), que vamos a citarlos
portar físicamente muestras aleatorias equivalentes a aulas aquí como ilustración concreta de la práctica óptima. Su estudio
distintas, etcétera. indica que breves comentarios escritos agregados a exámenes
A la luz de estas consideraciones, así como de observaciones objetivos que se devuelven a los alumnos hacen mejorar el ren-
personales de los experimentadores que han publicado datos dimiento en pruebas objetivas posteriores. A esta conclusión se
pese a tener un rapport tan pobre que sus hallazgos eran bas- llegó actuando con 74 maestros, 12 consejos escolares, 6 nive-
t:mte engañosos, los autores del presente volumen van lle- les o grados (7-12), 5 niveles de rendimiento (A, B, C, D, F)
gando poco a poco a la conclusión de que la experimentación y gran variedad de sujetos; no hubo casi prueba alguna de
dentro de las escuelas debe realizarse, siempre que sea posi- efectos de interacción.
ble, con el personal regular de ella, en especial cuando los Los alumnos y las clases se eligieron al azar. Se empleó como

46 47
pretest el primer examen objetivo regular en cada clase. Arro- los estudiantes como si se los hubiese asignado al azar. Los
jando un dado especial, el maestro asignaba alumnos a grupos detalles se estudiarán en el capítulo siguiente.
de tratamiento y, según los rnsos, agregaba o no comentarios
escritos a la prueba. La siguiente prueha objetiva, tomada de
acuerdo con la progrnmación normal, pasó a ser el postes t. Tests de significación para el diseño 4
Hasta donde pudo determinarse, ninguno de los 2.139 alum-
n<:s se ente~ó de 1''. experimentación. PtlCOs son los procedi- Hay que distinguir el diseño experimental del uso de tests
mientos de mstnicc1011L·s qne se prestan a estc1 tan disimulada estadísticos de significación. El primero es el arte de lograr
aleatoriz,1ción, ya que por lo común la cornunícición oral ne- comparaciones interpretables y, como tal, sería necesario aun-
ccsarí:1 se dirige a toda fa clase y no a alg11nos individuos. (Lis que el producto final consistiera en porcentajes graficados,
comuni~,iciones escritas permiten la alcatorizaCÍ(Ín, aunque la fotografías de grupos en acción, etc. En todos estos casos, la
captac1on, por parte del estudiante, de los distintos trata- interpretabilidad de los «resultados» depende del control so-
mientos constituye un problema.) Teniendo en cuenta est,1s bre los factores a que hemos hecho referencia. Si la compara-
ideales los invcstig:Hlores pueden lograr que lo~ cxperimcntc,s ción es interpretable, se requieren tests estadísticos de signi-
tengnn menos carncterísticas reactivas que en la ac,ualidad. ficación para decidir si las diferencias obtenidas exceden o no
Por medio de exámenes regulares tomados en el aula, o tests las fluctuaciones previsibles cuando no existan verdaderas di-
presentados corno exámenes regulares y análogos en su con- ferencias para muestras de ese tamaño. El uso de tests de sig-
tcrndo, a la vez que mediante procedimientos altcrnMivos nificación presume que es factible establecer comparaciones en-
d~ enseñanza presenta.dos, sin previo aviso ni petición de tre los grupos, y que la diferencia descubierta es interpretable,
disculpas, en d ~urso de las actividades escolares, es probable pero no da pruebas de el1o. De ahí que nos gustaría exponer el
que en Li mayona de los casos puedan evitarse estas dos cau- diseño experimental sobre la base del sentido común y de con-
sas de dispositivos reactivos. A veces, en grandes escuelas ~e- sideraciones no matemáticas. Esperamos que la mayor parte
cundarias o en universidades donde los alumnos se inscriben de esta obra resulte accesible a los estudiantes de ciencias de
en cursos populares dictados en determinados horarios y dt'.S- la educación que carezcan todavía de preparación estadística.
pués se los asigna en forma arbitraria a múltiples diví~ioncs No obstante, hay que reconocer que la cuestión de los proce-
simult:íne~s, podrían lograrse secciones de equivalencia alea- dimientos estadísticos está íntimamente vínrnlada al diseño
t(:ria medi:mle el control del proceso de asignación ( véase en experimental, razón por la cual ofrecemos estos comentarios
S1egcl. y S1egel r1957] la aplicación de un proceso aleatorio particulares sobre el tema. [Véase, asimismo, Green y Tukey,
natun'.l, que se_ apr:ivc~hó en esta forma). Sin embargo, por 1960; Kaiser, 1960; Nunnally, 1960, y Rozeboom, 1960.]
la .ªc~K?n de ~1stor1as mtragrupales únicas, tales secciones, al
pr111cip10 cqrnvalentes, se tornan con el correr del tiempo en Una estadística errónea de uso común. Aunque el diseño 4 es
segmentos cada vez más diferer.cíados. el común y frecuente, los tests de significación que con él se
Lr solución a este problema, aplicable en J!pzeral, es trasla- utilizan son a menudo erróneos, incompletos o inaptopiüdos.
dar la alea/o~ización al aula tomada como unidacl y consttuir Al aplicar la «razón crítica» común o prueba t a ese cliscño
grupos experimentales y de control, constituido cada uno de experimental estándar, muchos investigadores han computado
ellos por muchas aulas asignadas al azar I véase Lindquist, dos t: una para la diferencia pretest-postest en el grupo ex-
1940, 1953]. Por lo común, aunque no es imprescindible, los perimental y otra para la ganancia pretest-postest en el gru-
cursos se clasifirnrfon para su análisis sobre la base de facto-• po de control. Si la primera resulta «estadísticamente signi-
res corrn? escuela, 1:1aestro o ( cuando este tenga varias clases}, ficativa» y la otra «no», llegan a la conclusión de que X tuvo
hor:i, asignatura, rnvel intelect~al medio, etc.; de ellos se asig- un efecto, sin ninguna comparación estadística directa ent~e
nanm:i por un proceso aleatcmo varios grupos de tratamiento el grupo experimental y el de control.. A menudo las cond;-
~xpenmental. Ya se han realizado algunos estudios de est,1 ciones fueron tales que, de haberse aplicado una prueba mas
mdole, per? c:e_em<?~ que pr~nto se generalizarán. Nótese que apropiada, la diferencia no habría sido significativa ( como
el test de s1gmftcacton apropiado no consiste en mezclar todJ.i cuando los valores de significación son casos límites y el gru-

48
49
po de control indica una ganancia que casi alcanza el nivel para el experimento habitual de laboratorio. En casos muy
de significación) . Windle [ 19 54] y Cantor [ 195 6] han de- raros, como el estudio de Page [1958], hay un muestreo real
mostrado la frecuencia de este error. tomado de un gran universo predesignado, que se apropia las
fórmulas habituales. En el extremo opuesto se encuentra el
Utilización de puntaies de ganancia y covariancía. La prueba experimento de laboratorio presentado en el Journal of Ex-
aceptable de uso más común consiste en computar para cada perimental Psychology, por ejemplo, en el que la validez in-
grupo puntajcs de ganancia pretest-postest y calcular unq t terna ha sido la única consideración y todos los integrantes
entre los grupos experimentales y de control sobre la base de de un pequeño universo único se asignaron a los grupos de
esos puntajes. El «bloqueo» o «nivelación» aleatoria de pun- tratamiento. En este tipo de prueba se pone gran énfasis en
tajes pretest y el análisis de covaríancia utilizando como co- el procedimiento aleatorio, pero no a fin de asegurarse la re-
variable los puntajes de pretest son, por lo común, preferibles prescntatívidad respecto de otra pobhición mayor, sino al ex-
a las simples comparaciones de puntajes de ganancia. Puesto clusivo efecto de igualar los grupos experimentales y de control
que la mayor parte de los experimentos en educación no acu- o los distintos grupos de tratamiento. La aleatorización se apli-
san diferencias significativas, y por lo tanto no suelen infor- ca, pues, a una población finita muy reducida, que es en rea-
mar_se, el uso de este análisis más preciso parece ser muy c,on- lidad la suma de los grupos experimentales y de control.
vemente. Considerando la labor que implica conducir un ex- Esta posición extrema sobre el universo de muestreo se jus-
perimento, el trabajo de realizar el análisis correcto es relati- tifica cuando se describen procedimientos de laboratorio de
vamente trivial. Para más detalles, pueden consultarse trata- esta índole: se solicitan voluntarios, prometiéndoles o no una
mi.entos estándt1t de análisis del tipo Fisher [ véanse también gratificación en dinero, puntajes de personalidad, punta-
Cox, 1957, 19.58; Feldt, 1958, y Lindquist, 1953]. jes para la aprobación de cursos, o cumplimiento de un re-
Aspectos estadísticos de la asignación aleatoria a tratamientos quisito obligatorio que de todos modos tendrán que satisfacer
de cursos intactos. La estadística habitual solo resulta apro- en algún momento del curso académico. A medida que llegan,
piada en casos de asignación aleatoria de alumnos individua- se los va asignando al azar a los distintos tratamientos. Cuan-
les a los trMamientos. Si, en cambio, se asignaran cursos intac- do se ha alcanzado determinado número de sujetos, se inte-
tos, las formuhis precedentes darían un término de error de- rrumpe el experimento. Ni siquiera ha habido una selección
masiado pequeífo, pues, como es natural, el procedimiento de aleatoria entre los integrantes de una lista mucho mayor de
aleatorizm:ión habn'í sido más «global» y se habrán utilizado voluntarios. Los primeros constituyen una muestra sesgada y
menos ,1contccimientos aleatorios. Lindquist (1953, págs. el universo total «muestreado» cambia de un día a otro a
172-89] ha suministrado el fundamento lógico y las fórmu- medida que el experimento continúa, que se requiere más
las pam la reafomción de un correcto análisis. En esencia, se presión para reclutar voluntarios, etc. En un momento dado
emplean las medias de la clase como observaciones básicas, se detiene el procedimiento, después de haberse utilizado a
y se prueban los efectos del tratamiento contra variaciones en todos los miembros designables del universo en uno u otro
esas medi;.1s. Un análisis de covatiancia utilizaría como cova- de los grupos de tratamiento. Nótese que los sesgos implica-
riahle medias pretest. dos de muestreo no amenazan en lo más mínimo la equiva-
lencia aleatoria de los grupos de tratamiento, sino solo su
Aspectos estadísticos de la validez interna. Las observaciones «represen tativídad».
precedentes se hicieron a fin de dar a conocer la ortodoxia Consideremos ahora a un científico más meticuloso, que de
estadística reh1tiva al diseño experimental. Las siguientes re- una clase integrada por 250 personas extrae 100 al azar, se
presentan un esfuerzo por ampliar o corregir esa ortodoxia, pone en contacto con ellas por carta o por teléfono y, después
extendiendo al terreno de la estadística del muestreo una in- de entrevistarlos, los asigna, también al azar, a grupos de tra-
ferencia de la distinción entre validez externa y validez inter- tamiento. Por supuesto, unos 20 de ellos no pueden ajustarse
na. Los. principios estadísticos antes analizados implican en al horario de laboratorio, están enfermos, etc., por lo cual
su totalid¡id::•el muestreo en un universo infinitamente gran- se ha producido una redefinición implícita del universo. Y
de, más a¡:fr9p,i~do para tma encuesta de opinión pública que aunque gracias a su perseverancia consiga los 100, lo que ha-
............ - ·-· \\1'\.
·r:)·;-·::c_t,
50 ...... ·----· < }! 51
'/~/
1/
..._,,:~~,:~);:J!
brá ganado, desde el punto de vista de la :epresenta~iv~dad, 1· social, aunque no todavía con la investigación pedagógica),
será la posibilidad de generalízar con se~unda? e~tad1st~ca a , ·,e error -~si lo es- será siempre preferible. La posibilidad
propósito del curso del año 1961 de Ps1colog1a Educacional , le subestimar la significación es mayor cu.ando solo hay dos
A en la Escuela Normal del Estado. Este nuevo universo, , ·ondicioncs experimcn tales y se emplean todos los sujetos
aunque mayor, carece de positív<;> interés ci~ntíf~co., ~us lími- ,lisponíblcs [Wilk y Kempthorne, 1955, piíg. 1154 ].
tes no son los estatuidos por nmguna teorrn c1ent1fica. Los
aspectos de verdadero interés para la generaliza~ión deberán
explorarse por medio del muestreo de experimentos r~a-
1ízados en otros lugares. Por supuesto, al ser menos selecc10- Disci'w de cuatro grupos de Solomon
nados sus alumnos, se tiene una mayor validez exter1;1a~ pero
no ganancia suficiente para que la mayoría de los ps1cologos Aunque d diseño 4 se usa m,is, el 5, denominado diseño de
experimentales consideren que se compensa con ello el es- cuatro grupos de Solomon [ 1949] tiene con tazón un ma-
fuerzo realizado. \'Or prestigio y constituye la primera consideración explícita
Resulta, en general, obvio que el fin principal que se l?ersi- de factores de validez externa. El diseño es el siguiente:
guc con la aleatorización en experimentos de la~oratono _e_s
la validez interna, no la externa. Por tanto, habna que utili- R 01 X 02
zar m1írgenes de error más reducidos y apropiados, basados R Oa 04
en pequeños universos finitos. Siguiendo a Kempthorne R XOi;
["1955] y Wilk y Kempthorne [1956], creemos que el mo- R 06
delo correcto es la aleatorización en urnas en vez de la extrac-
ción de muestras de un universo. De ese modo se dispone de Traz,irnlo u1 forma paralela los elementos del diseño 4 ( 01
un test no pnramétrico más apropiado y preciso, en _el cual a 0.1) con los grupos experimental y de control sin pretest,
se toman los puntajes obtenidos en los grupos experimenta- cabe determinar tanto los efectos principales de la realización
les y de control y se los asígna una y otra vez a dos «urnas», de la prucha como la interacción entre ella y X. De ese modo,
generando empírica o matemáticamente ui:a dístribu 7íón ?e no solo se alimenta la posibilidad de generalizar, sino que
diferencias medias que resultan en su totalidad de as1gnac10- además se repite el efecto de X en cuatro formas diferentes:
nes aleatorias de esos puntajes particulares. Tal distri~udón 02 > O,, O:t > 04, Or; > 06 y 05 > Ü3. Las inestabilidades
constituve el criterio con que debería compararse la diferen- concretas de la experimentación son tales que, si esas compara-
cia media obtenida. Cuando exista una «interacción posición- ciones concuerdan, el vigor de la ínferencia queda muy incre-
tratamiento» ( heterogeneidad de efectos reales entre los mentat1o. Otra contribución indirecta a la posibilidad de ge-
suíetos), esa distribución tendrá una variabilidad menor que neralizar los hallazgos experímentales es también que, en vir-
la correspondiente distribución adoptada en la prueba común. tud de la experiencia con el diseño 5 en cualquier ámbito de
Con estos comentarios no pretendemos modificar mucho la investigación dado, se averigua la posibilidad general de in-
actual práctica en la administración de tests de significación teracciones de «pruebas por X», pudiéndose así interpretar
en la investigación pedagógica. Las soluciones exactas son mejor los diseños 4, tanto futuros como pasados. Asimismo,
difíciles de conseguir y, por lo común, muy laboriosas. La alea- puede advertirse ( comparando 06 con 01 y O,i) un efecto
torizadón por urnas, por ejemplo, suele exigir la utilización combinado de maduración e historia.
de computadoras de gran velocidad. La dirección del error es
conocida: el empleo de la estadística tradicional es demasiado
conservador con una excesiva tendencia a decir «no se regis- Pruebas estadísticas para el diseño 5
tran efectos:>. Si juzgamos que nuestras publicaciones están
saturadas de «falsos positivos», es decir, de información so- No hay ningún procedimiento estadístico particular que utili-
bre efectos que no resiste la prueba de una validación cru- ce a un mismo tiempo los seis conjuntos de observaciones.
zada ( como acaece, por cierto, con la psicología experimental Las :::simetrías del diseño descartan el análisis de la variancia

52 53
de puntajes. ( Las sugerencias de Solomon a este respecto se , li: la información presentada al jurado por el abogado defen-
consideran inaceptables.) Dejando de lado los pretests, salvo ., ir. El diseño 6 responde a esa necesidad, y además es apro-
como un nuevo «tratamiento» coordinado con X, se pueden 1,iado para todas las situaciones en que podrían utilizarse los
estudiar los puntajes postest mediante un análisis 2 X 2 diseños 4 o 5, es decir, aquellas en que es posible una ver-
del diseño de variancia: .ladera alcatorízación. Su forma es la siguiente:

Sin X R
Con administración de pretest 01 R
Sin administración de pretest 01,
Si bien este diseño se utilizaba ya en la década de 1920, la
Sobre la base las medias de las columnas se estima el 111ayorfa de los textos. metodológicos no lo han recomendado.
efecto principal de X; de las medias de las filas, el efecto l<Jlo se debió en parte a que se lo confundía con el diseño
principal del pretest y de las medins ele casilleros, la ), y también a la falta de confianza en la aleatorización como
intc:racción entre la aplicación del t<.:st y X. Si los efectos procedimiento de igualación.
principales e interactivos de la aplicación de las pruebas son Puede considerarse que este diseño comprende los últi-
muy pequeños, acaso sea conveniente realiz,ir un a111ílisis de mos dos grupos idel diseño de cuatro grupos de Solomon;
covariancia de Oi contra 0 2 , con los puntajes del pretest por rnntrola la aplícadón del test como efecto principal y la in-
covariable. 1eracci6n, pero, a diferencia del diseño 5, no los mide. Sin
nnbargo, esa medición es tangencial a la cuestión básica de
si X tuvo o no un efecto. Así, pues, el diseño 5 es preferible
:11 6 por las razones apuntadas, pero las mayores ventaias
6. Diseño de grupo de control con postest (!el 5 quizá no justifiquen el esfuerzo que demanda ( más del
únicamente doble ) . Asimismo, el diseño 6 es por lo común preferible al
4, a menos que haya alguna duda a propósito de la autenti-
El prctest es un concepto muy arraigado en el pensamiento ddad del prnccso aleatorio de asignación. El diseño 6 se usa
de los investigadores en los campos de la educación y la psi- demasiado poco en investigación educacional y psicológica.
cología, pero en realidad no es imprescindible para los dise- Pero en el caso de repetición de pruebas, que se presenta
ños experimentales propiamente dichos. Por razones psico- con frecuencia en la investigación educacional, si se dispone de
lógicas, es difícil renunciar a «t<"ner la seguridad» que los antecedentes apropiados en materia de variables, se los debe-
grupos experimentales y de control eran «iguales» antes del ría emplear para bloqueo o nivelación, o como covariables.
tratamiento experimental diferencial. No obstante, la aleato- Esta recomendación la hacemos por dos motivos. Primero,
rízacíón implica la mayor seguridad, aplicable a cualquier fin, porque las pruebas estadísticas en que se apoya el diseño 4
de la carencia de sesgos iniciales entre grupos. Dentro de los son más decisivas que las existentes para el 6. El esfuerrn
márgenes de confianza establecidos por las pruebas de signi- que exige el diseño 4 anula esta ventaja en la mayor parte
ficación, la aleatorización puede ser suficiente, sin necesidad de las situaciones de investigación, pero no ocurriría así si se
de recurrir al pretest. En realidad, casi todos los experimen- dispusiese en forma automática de antecedentes apropiados
tos agrícolas realizados en la tradición de Fisher [ 1925, 1935] sobre puntajes. En segundo lugar, la disponibilidad de pun-
carecen de pretest. Más todavía, en investigación pedagógíca, tajes pretest permite examinar la interacción de X y el nivel
sobre todo en los grados primarios, tenemos que experimen- de habilidad en el pretest, explorando así más a fondo la
tar a menudo con métodos que permitan la introducción ini- posibilidad de generalizar el hallazgo. Algo similar puede ha-
cial de elementos absolutamente nuevos, para los cuales son cerse a propósito del diseño 6, empleando otras medidas dis-
imposibles los pretests en el sentido ordinario del término, lo ponibles en vez del pretest, pero estas consideraciones, suma-
mismo que estarían fuera de lugar los referidos a la presunta das al hecho de que para la investigación pedagógica los tests
culpabilidad o inocencia en un estudio acerca de los efectos frecuentes son característicos del universo al cual se ~"'ª''ª"

54 55
extender las generalizaciones, pueden invertir el criterio de como medición postest, a causa de su probable insensibilidad
preferir por lo común el diseño 6 al 4. Nótese asimismo que a X si se lo compara con una medición más específicamente
para cualquier mortalidad sustancial entre R y el pos test los apropiada en contenido y oportunidad. No tiene mucha im-
datos de pretest del diseño 4 ofrecen mayores oportunidades portancia decidir si ese seudodiseño de pretest debe cbsifi-
de eliminar la hipótesis de mortalidad diferencial entre los carse como 6 o como 4. Tendría las ventajas del primero, ya
grupos experimental y de control. que evitaría una sesión pretest introducida por el experinren-
Aun así, hay muchos problemas para los cuales no se dispone tador, así como la «reveladora» repetición de un contenido
de pretests, o estos resultan inconvenientes o capaces de pro- poco usual idéntico o muy similar ( como en los estudios de
vocar reacciones, y para esos casos es preciso seguir insistien- cambios de actitud). Por es tas razones la inclusión del dise-
do en muchos sectores acerca de la legitimidad del dise- ño 6 bajo el título de «Dispositivos reactivos» debería ser algo
ño' 6. Ade1mis de los ~studios sobre el modo de enseñar más positiva que respecto de los diseños 4 y 5. La justifica-
material nuevo, queda una gran cantidad de casos en los que ción de esta diferencia es, por cierto, mucho más válida para
la X y la O postest pueden entregarse a los alumnos o grupos las ciencias sociales en general que para la investigación sobre
como un solo «paquete» natural, y un pretest resultaría mo- instrucción pedagógica.
lesto. Tales situaciones se producen con frecuencia en los
mismos procedimientos de prueba, así como en estudios de
instrucciones distintas, planillas de respuesta de formato di-
ferente, etc. Algo similar ocurre con los estudios sobre cam- Diseños factoriales
pañas para reclutar voluntarios, etc. En los casos en que hay
que guardar el anonimato del alumno, el diseño 6 suele ser Sobre la base conceptual de los tres diseños anteriores, pero
el más conveniente, encarándose entonces la aleatorización en particular el 4 y el 6, pueden ampliarse las complejas eh
por medio del ordenamiento mezclado de materiales destina- boraciones típicas de los diseños factoriales de Fisher, agre-
dos a la distribución. gando otros grupos con otras X. En un criterio típico de cla-
sificación única o análisis de la variancia «en un solo sentido»,
tendríamos varios «niveles» del tratamiento, por ejemplo,
Aspectos estadísticos del diseño 6 X1, X:2, X:i, etc., y quizá también un grupo Xo ( ausencia de
X). Si se considera el grupo de control como uno de los tra-
El modo más sencillo sería la prueba t. El diseño 6 es qwza tamientos, habría en los diseños 4 y 6 un grupo para cada
la única situación para la cual esa prueba es óptima. Sin em- tratamiento. En el diseño 5 habría dos. grupos ( uno some-
bargo, se pueden emplear el análisis de covariancia y el tido a pretest, el otro no) para cada tratamiento, y aun sería
bloqueo de «variables sujeto» [Underwood, 1957 b], así como posible un análisis de variancia de doble clasificación ( «en
niveles anteriores de educación, puntajes en tests, ocupación dos sentidos»). No tenemos noticia de que se hayan realizado
de los padres, etc., consiguiéndose así mayor poder del test diseños del tipo 5 en más de dos niveles. Por lo común, si
de significación, muy similar al que brinda un pretest. No es nos preocupa la interacción pretest, empleamos el diseño 6,
necesario que el pretest y el postest sean idénticos. A menudo a causa del gran número de grupos que de no hacerlo así
serán formas diferentes «del mismo» test y por lo tanto me- serían necesarios. Muy a menudo se utiliz::irán dC1s o m,is varia-
nos idénticos que una repetición del pretest. La mayor pre- bles de tratamiento, una en cada uno de los distintos «nive-
cisión obtenida se vincula en forma directa con el grado de les», dando una serie de grupos que podrían designarse Xa1
covariancia, y aunque esta suele ser más elevada en formas Xa1, Xa1,Xv2, X1i1 Xb:1, ... , Xa2 Xb1, etcétera.
alternadas «del mismo» test que en tests «diferentes», se Tales elaboraciones, complicadas con intentos de economizar
trata de una cuestión de grado tan confiable y factorialmente eliminando algunas de las posibles_ permutaciones de Xa por
compleja como la superioridad eventual de un promedio pun- Xa, han producido parte de los inquietantes misterios del di-
tual respecto de un breve «pretest». Adviértase, sin embargo, seño factorial (bloques aleatorizados, parcelas divididas, cua-
que un promedio puntual no es por lo común conveniente drados grecolatinos, repetición fracciona!, confusión, etc.),

56 '57
orip:cn de b enorme brecha que separa las mu udologfas avan- ,zteracción
zad,\, de Li:; tr,1dící,rn:1k,; Cll e[ ,ímhito de Li i11vc.-;rigacion
educacmna1. Lspernmos que ,sta obra ayude a salvar ese vacío \ á hemus utilizado este conceptu en síwaciont:s en que, st:-
por medio de una continuidad con la metodología tradicional creemos, el lector no especializado lo habrá encontrado
y l:1_, consideraciones dictnd:1s ¡,or el sentido cn111iín qu,' el cs- , omprensihle. Como anres, insistimos aqní en bs consecuen-
tud:.1 11e llcvc1 s1e1n111c crnisi¡,(). '.L.uuhicu estim,1mob q:1~· gran ' ias relativ:1s a h p,1sibilid:1d de g,·ncr:1foa1·. Expu11dremus en
parte de lo que debe enseñarse sobre disefio experimental se forma gráfica ( figura 2) cinco posibles resultados de un di-
entiende rncj,1r si se lo expone: en Íurm<1 de diseños de dos seño con tres nívdes, compuesto cada uno de ellos de Xa y
tr,1urní,:11t(1.-1, sin íntcrf,·rc11<:·,1 clt: (l!r:is No X1,, que de1101nín:1rcnws A \! B. ( Puc:sru Cjt!e se han de gra-
obstante, la cxposicí<in completa de los problemas planteados hcar tres dimensiones LA., B Y O J en dos, son varías las
por el uso común provocará una comprensión mayor tanto de present,1cíones que resultan posibles, de las cuales no
fo nn-csi,bd como de ];¡ loc:1L-'.,ll)Í(Ín ,le mo, c1,f,1C¡ucs. •emos m:ís que un:i.) En la fignr:1 2 ( c1) puede aprcci:use un
Al bmcar la ll. rt11a n1,ís cfíGtZ <le resumit· el anticuado pero tan
1 :10tahk celo principal 1a11tu p,1u 11 cu1:Iu para /;, peru nin-
dífull(lido disL:ño 4 •1os vÍJr1<is ya constrcfiidos a disponer guna intcrncción. (Hay, por supuesto, una suma de efectos
de 1m an:ílisi, cov:1riancin. c:1si no ntílíz:1'10 en cst,1 situa- ~-siendo A:1, Jl:, d m,ís fuerte---, pero ninguna ínteraccil'ín,
cí1'in. Y e11 ,.¡ dís,·1ín ':i, con u11 proh!cu1,1 <k , 1os tr:1rn111íentos :,a que los efcct,1, son .1,litivos. _í En tud()s los dc11uís casos
que :;l'. dabur;1 sólo para obtener controles necesarius, nos encontramos interacciones significativas adicionales, o bien en
alejarnos de las relaciones críticas o pruebas t, v nos introdu- rcempLvo de los efectos principales de A v B. Es decir que la
einl<·\ e11 h esL1clís1íc,1 del a11cílisis d<' \':tríanc1:1.· 'cv sohrc ,.:1 cfcc1,i de 1\ varía acuerdo con el valor cspc-
Los detalles de los análisis estadísticos para diseños facto- dfico de 1>.
riales no pueden enseñarse ni aun e;-;hozarse siquiera en esta En este sentido, los efectos de interacción son reglas de espe-
ohr:1. Fdw:1rds r1960 1, fergu:,on [ 195<)]' Jolmso11 V Ltckson cificidad ,le cfcctn y, p,,r t:rnto, cond11Cen al intento de g,"ne-
[J:J'i') 1 y Lilldquist l 19'.53J vresenLm ü los illvcsti1~adon.:s rali,:aci{m. T~J efecto de inter.iccíón en 2(d) es, sin duda
P.edug,;gícos aspectos clement.iles de tales métodos. Co1i'iiamos, dguna, de ese orden. Aquí, A no produce un efecto principal
stn embargo, t:n que las explicaciones siguientes permitirán ( es decir que, si se promedian los valores de las tres B p,1ra
?l¡i,u1u 111nyur c~111Ipn 1i:-;i,ín d,· ciertas alternativas y complc- c:ad:t /l, resulta 1111a línea hori:-:c1 ntal). Pero n131irJo se man--
Jldadcs de particular relevancia en los aspectos de diseño tiene B en el nivel 1, los aumentos en A producen un efecto
anali1,1dos en nuestu obra. I .as complejidades que tenemos decreciente, en tanto que sí se mantiene B en d nivel .3, A
qnc. ,rn:1lí:-::1r 11,1 corn¡,rcndcn Lis razones comunes p,1r,.1 rc.- tiene 1117 dcctu i11,-rcme11tal. Nc'ítcse que si el experimentador
curnr ;1 cu.adrados latinos ni a muchos otros discüos incom- sólo hubiese variado il, manteniendo B constame en el nivel
pletos en que el conocimiento de ciertas interacciones se sacri- 1, los resultados, aunque internamente válidos, hubiesen dado
fica pur merc1s razones de costo. ( PPro el uso ele ri,adrados pie a que se hiciesen generalizaciones errc'Íneas a propósí ro de
L11 i11u, como .Sl1stitut, de los grupos de co11tr,,I en Ju_-; cisos
1 !i:: y ll,1. I .a característic:i de rmíltíple factorial dd diseño ha
en que no h:1v modo de aleatorizar se estudiará 1mís Hckbnte, Hevado, pues, a realizar valiosas exploraciones sobre la posi-
c?mo diseño_ cuasiexperimental 1 l.) La razón de haber pres- ble generalización o validez externa de cualquier enunciación
c111cl:,clo aquí de es(1, disei1,," incornp]ctos e:; que ¡,,1r:1 el 1111aría ,obre el dccto principal de A. Las Iimíi:1cíones de la
prob,ema de validez externa resulta rnuv conveniente contar posibilidad de generalizar o de L1 espdicidHd de los efectos
con un conocimiento detallado de las int;racciorks, sobr,: todo aparecen en el análisis estadístico como interacciones signifi-
en m:11 ciencia que ha tenido proh1enrns para rt~pctir los dcs- cativas.
nd1rirn icnt c1s de un í11vcstíg,1d,>r en urro ambiente ch.,;tínto La fig1H,1 2(c) representa una forma de interacciéin aiín méÍs
[ véase \'{lilk y Kempthorne, 1957]. Los conceptos que tra- extrema: ni A ni B producen efecto principal alguno ( no re-
tamos de exponer en este capítulo son los de la ínter:1cci6p, sultan reglas generales sobre qué nivel de ambas es mejor)
l:i:; cL>irirnciu11,·s incL;-,Ívas v 1:is c-l:1;,ifi--,1cí,111cs \' los ;Jero Lis intcr-,1ccíunes wII fuerks y hien ddinicLis. Con,idc-
modelos factoriales finitos, fijos, aleat(1r:os y mixtos. • remos un resuhado hipotético de esta índole. Supongamos

59
Figura 2. Algunos resultados posibles de un diseño factorial que tres clases de maestros son, en general, de la misma
3 X 3. eficiencia ( p. ej., los improvisadores espontáneos, los que pre-
paran a conciencia SU, trabajo y los que supervisan con esmero
Grados ele O Grados de O la tarea de sus alumnos). Asimismo, tres métodos de ense-
ñanza resultan, en general, de idéntica eficacia (p. ej., dis-
cusión en grupo, exposición formal y supervisión individual).
(h) /B.,
En tal caso, aun en ausencia de «efectos principales» en cual-
quiera de los tipos de maestros o métodos pedagógicos, podría

1/"
ocurrir que estos segundos tuviesen gran interacción con la
modalidad del maestro: el improvisador espontáneo tendría
más éxito con la discusión en grupo y menos con la super-
visión individual, mientras que el acostumbrado a seguir de
cerca a sus alumnos alcanzaría los mejores resultados en la
- - - - - - B, supervisión individual y los peores en el sistema de la discu-
sión en grupo.
A, A, Desde este punto de vista, cabe distinguir los tipos de interac-
Grados de O Grados de O
ciones significativas halladas. Quizá nos resulte provechoso un
concepto como el de «interacciones monótonas». Nótese que
( e) 73,. ( d) en 2 ( b ) , como en el 2 ( a) , hay un e.fecto principal tan to de
A como de B, y que A produce el mismo efecto direccional
en cualquier panel separado de valores de B. En consecuencia,
~B, nos sentimos mucho más seguros si generalizamos a situacio-
nes nuevas la expectativa de aumento en O con aumentos
en A que si lo hacemos en 2(c), que podría producir también
• • • B" efectos principales significatívos en A y B, así como u.:1.a m-
teracción A-B significativa. En realidad, podríamos estar casi
~B, tan seguros de la generalidad del efecto principal de A en el
caso 2 ( b) como en el 2 (a), libre este de interacción. Por
A, A., A, cierto qu.e al interpretar .efectos con miras a la generalización
se las debería graficar y examinar bien, en todos sus detalles.

¡
Grados de O

(el
Algunas interacciones «monótonas» o unidireccionales pro-
ducen pocas limitaciones - y a veces ninguna- sobre la es-
pecificidad. ( Véase en Lubin [ 1961 ] un profundo estudio <le
este problema.)

Clasificaciones inclusivas

En los ejemplos dados hasta aquí, todos los criterios de cla-


sificación ( las A y las B) se han «cruzado» con todos los
demás criterios. Es decir que todos los niveles de A se han
A, A dado con todos ]os niveles de B. Sin embargo, el análisis
de variancia no se limita a esa situación.
Hasta ahora hemos utilizado, a título de ilustración, criterios

60 61
de clasificación que eran «tratamientos experimentales». Otros lo común «inclusivos» dentro de las escuelas, ya que lo ha-
tipos de criterios de clasificación, como el sexo y la edad de bitual es que un maestro dé clases en un solo colegio. En
los alumnos, podrían introducirse en muchos experimentos en este caso es concebible una interacción maestro-escuela, pero
forma de clasificaciones plenamente cruzadas. Pero a fin de no se la podría computar a menos que todos los maestros
incorporar los usos más comunes de clasificaciones «inclusi- enseñasen en uno y otro establecimiento, en cuyo caso maes-
vas», presentaremos la posibilidad de criterios de clasificación tros y escuelas serían «cruzados», no «inclusivos».
menos obvios. Uno de ellos es «maestros». Operando en el A los alumnos, o sujetos de un experimento, también se los
nivel de cruzado total, se podría hacer una prueba en una puede tratar como criterio de clasificación. En un mecanismo
escuela secundaria en la cual diez maestros emplearían uno totalmente cruzado, a cada alumno se lo somete a cada uno
de los dos métodos posibles para enseñar una determinada de los distintos tratamientos, pero en muchos casos entra en
asignatura a distintos cursos experimentales. En ese caso los varios, aunque no en todos, los tratamientos; es decir que
maestros serían un criterio de clasificación absol11tamente no se produce el fenómeno ele la inclusión. Un caso frecuente
cruzado, pues cada uno de ellos constituiría un «nivel» dife- es el estudio, durante el aprendizaje, de datos obtenidos por
rente. El «efecto principal» de los «maestrosr, sería la evi- pruebas individuales. Aquí podríamos tener curvas de apren-
dencia de que algunos de ellos son mejores que otros, con dizaje para los distintos alumnos, divididos estos entre dos
prescirnlencia del método que emplearon. ( Los estudiantes o métodos de estudio. Podrían analizarse las interacciones prue-
las clases se habrán asignado al azar; de lo contrario se con- ba-método y alumno-prueba, pero no alumno-método. Si a
fundirían las idiosincrasias del maestro con las diferencias de los alumnos se los clasifica por el sexo, se genera también
selección.) Una interacción significativa entre maestros y mé- un fenómeno de inclusión.
todos significaría que el método que mejor funcionó había Casi todas las variables de interés en la experimentación edu-
dependido del docente en particular a quien se estaba consi- cacional pueden cruzarse con otras variables y no tienen por
derando. qué ser objeto de inclusión. Excepciones notables, además de
Supongamos ahora, siguiendo una interacción de esta índole, las ya mencionadas, son la edad cronológica, la edad mental,
que nos interesa conocer si, en general, una técnica dada es el grado escolar ( primero, segundo, etc.) y el nivel socioeco-
mejor para maestros que para maestras. Si dividimos ahora nómico. El lector inteligente habrá notado que las variables
nuestros diez maestros en cinco hombres y cinco mujeres, se independientes, o los criterios de clasificación, pertenecen a
obtiene una clasificación «inclusiva» en el sentido de que la distintos tipos: 1) variables manipuladas, como el método
clasificación maestros, aunque todavía útil, no considera los de enseñanza, que el experimentador puede asignar a volun-
sexos; es decir que el mismo maestro no aparece en uno y tad; 2) aspectos potencialmente manipulables, como mate-
otro sexo, en tanto que cada maestro y cada sexo sí considera rias estudiadas, que el experimentador podría asignar de al-
los métodos. Esta inclusividad exige un análisis algo distinto guna manera aleatoria entre los alumnos que utiliza, pero
de aquel en que todas las clasificaciones se cruzan entre sí. que rara vez lo hace; 3) aspectos re1ativamente fijos de!
( Un análisis ilustrativo puede verse en Green y Tukey [ 1960] ambiente, como comunidad, escuela o nivel socioeconómico,
y Stanley [1961a].) Además, quedan eliminadas ciertas inte- fuera del control directo del experimentador pero que sirven
racciones de las variables inclusivas. Así, no son computables de bases explícitas para la estratificación de la prueba; 4) ca-
-ni tienen, en realidad, sentido desde el punto de vista con- racterísticas «orgánicas» de los alumnos, como edad, estatura,
ceptual- las interacciones maestros-sexo y maestros-sexo-mé- peso y sexo, y 5) características de reacción de los alumnos,
todo. como puntajes en distintos tests. Por lo común las variables
«Maestros» también podría convertirse en una clasificación independientes manipuladas de la clase 1 son de interés fun-
inclusiva, si el experimento anterior se extendiese a varias damental, mientras que las variables independientes no ma-
escuelas, de manera que ellas viniesen a constituir un criterio manipuladas de las clases 3, 4 y a veces 5 sirven para aumentar
de clasificación ( en el cual los efectos principales acusarían la precisión y revelar hasta qué punto son generalizables los
diferencias en la tasa de aprendizaje de los alumnos de los efectos de las variables manipuladas. Las variables de clase 5
distintos establecimientos). En tal caso los maestros serían por aparecen de ordinario como covariables o variables <lepen-

62 63
dientes. Otra forma de considerar las variables independien- Otras dimensiones de extensión
tes es como intrínsecamente ordenadas ( grado, nivel socio-
económico, estatura, pruebas, etc.) o no ordenadas ( método Antes de abandonar los «verdaderos» experimentos a propó-
de enseñanza, asignatura, maestro, sexo, etc.). A menudo, sito de los diseños cuasicxperimentales, queremos explorar
los efectos de las variables ordenadas suelen analizarse más a algunas otras extensiones desde este simple núcleo, aplicables
fondo, a fin de ver si la tendencia es lineal, cuadrática, cú- a todos los diseños que se verán más adelante.
bica o de grado más elevado [Grant, 1956; Myers, 19591.

Aplicación de tests en busca de efectos mediatos


Modelos finitas, aleatorios, fijo.r y mixtos
En la esfera de la persuasión --bastante afín a la de la edu-
Hace poco, estimulados por el trabajo inédito de Tnkev Je] cación v la enseñanza-·, Hovland y sus colegas comproba-
año 1949, varios estadísticos rn,ltem,hicos crearon modelos ron e1{ reíteradas oportunidades, que los efectos a largo
«finitos» para el nnñlisis de variancias que aplican al mues- pla~o son no solo cuantitativa sino también cu~litati':'amente
treo de «niveles» de factores experimentales ( variables inde- diferentes. Estos efectos son mayores que los mmediatos_ en
pendientes) los principios, bien elaborados ya, del muestreo las actitudes generales, aunque má_s débiles e1.1 algunas actitu-
en poblaciones finitas. Scheffé [ 1956] publicó una reseña des específicas [Hovland, Lumsdame y Shefheld, 1949]. Las
histórica de aquel desarrollo clarificador. Se dispone de me- afirmaciones de una persona desacreditada carecen de ~fect?
dias cuadr,íticas esperadas, que ayudan a determinar «térmi- persuasivo inmediato, pero ese efecto puede resultar s1gnil1-
nos de error» apropiados [Stanley, 1956] para el diseño fac- cativo un mes más adelante, a menos que se recuerde ª. los
torial totalmente aleatorízado de tres clasificaciones. Los interlocutores de qué fuente provienen [Hovland, Jan1s Y
modelos finitos resultan de particular provecho porque pueden Kel lcv 19 5 3]. Estos descubrimientos nos alertan contra la
generalizi1rse con facilidad a situaciones en que uno o más de prácti~a de establecer toda nuestra evaluación experíment~l
los factores son aleatorios o fijos. Ferguson dio una sencilla de los métodos pedagógicos sobre la bn~e de postes~s o medi-
explicación de aquellas extensiones en 1959. ciones inmediatas realizadas en cualquier punto aislado del
En vez de presentar fórmulas, recurriremos a una ilustración tiempo. d ·
verbal para mostrar cómo difieren entre sí las selecciones finitq, A pesar de los problemas incomparablemente mayo1;es e eJe-
aleatoria y fija de niveles de un factor. Supongamos que en cución implicados ( y la incomodidad que ello constituye _pata
un experimento dado los ~<maestros» constituyen una de las el desarrollo del programa de nueve meses de una tes1_s, de
distintas bases de clasificación ( es decir, variables indepen- doctorado), nos permitimos recomendar que en la pla111f1c-a-
dientes). Si se dispone de 50 maestros, se podrían extraer ción de las investigaciones se incluyan períodos de postests de
5 de ellos al azar y utilizarlos en el estudio. Aparecería en- un mes, seis meses y un año. . .. .
tonces en algunas de nuestras fórmulas un coeficiente de Cuando las mediciones del postest consistan en calificaciones
muestreo de factores ( 1 5/50) o 0,9. Si se utilizara el to- y i;untajes de exámenes que de todos modos va_n_ a obtenerse,
tal de 50 maestros, constituirían un efecto «fijo», y el coefi- ese estudio será un simple problema de contabilidad ( Y mor-
ciente se convertiría en ( 1 - 50/50) = O. Por lo contrario, talidad). Pero cuando sea el experimentador quien íntr~d:1;-
si existiese una población prácticamente infinita de maes- ca las O casi todos los autores consideran que la repetlcion
tros, 50 de ellos elegidos al azar constituirían un porcentaje de medí;iones postest con los mismos alumnos se:ía más
infinitesimal, por lo que en cada efecto «aleatorio» el coefi- engañosa que el pretest. Así se ha comprobado por cierto en
ciente tendería a 1. Los anteriores coeficientes modifican las investigaciones sobre memoria [p. ej., ~nderwo~d? 1957_a,].
fórmulas de medias cuadráticas esperadas, y por lo tanto de Al paso que el grupo de Hovland recurna ~ la t1p1ca aph-.:a-
términos de «error». Más detalles pueden verse en Brownlee ción de un pretest ( diseño 4), ellos orgarnzaron grupo_s se-
[1960], Cornfield y Tukey [1956], Ferguson ,[1959], Wilk parados experimentales y de control para cada aplazamiento
yKempthorne [1956] yWiner [1962]. cronológico del postest, por ejemplo:

64 65
R o X o Pero ocurre lo contrario si por «saber» interpretamos la habi-
R o o lidad para seleccionar la correcta clasificación abstracta del
R o X o tratamiento v trasmitir eficazmente la información a nuevos
R o o destinatarios~ Con la entrevista grabada hemos repetido cada
vez muchos aspectos específicos carentes de importancia; has-
Para los diseños 5 o 6 se exigiría una duplicación similar de ta donde nos fue dado conocer, el efecto pudo haberse creado
grupos. Nót~s~ que este diseño carece de control perfecto por esos detalles y no por las características que incluimos
para su Pfoposlt? de comparar las diferencias en los efectos co- adrede. No obstante, si tenemos muchos ejemplos indepen-
mo f\mcion del t1em1x: trascurrido, puesto que tales diferencias dientes, los detalles específicos sin importancia no serán sus-
p_odrrnn deberse también a la interacción entre X v los aconte- ceptibles de repeticíón en cada caso, y por tanto será más
crn:i~ntos históricos específicos que se produjeron ~ntr~ ]a apli- probable que nuestra interpretación de la causa de los efectos
cac1011 de los postests de corto y de largo plazo. Un control sea correcta.
co1;1pleto de. esta posibilidad lleva a la elaboración de diseños Consíderemos, por ejemplo, la comparación de Guetzkow,
mas comr:le10s . tod:wía. A causa de los grandes gastos que Kelly y McKeachie [ 1954] entre los métodos de enseñanza
esos c~tud10s c:;=1ge:1, salvo cuando [as O se obtienen por algún por disertación y por discusión. Nuestro «conocimiento» de
mecan1sm? rutmario, parece recomendable que quienes reali- cuáles fueron los tratamientos experimentales, en el sentido
z,!n es~ud1os empicando O institucionalizadas reiteradamente de poder extraer recomendaciones para otros maestros, es me-
dispomb!es aprovec~1en la ventaja que ello representa y realicen jor porque se emplearon ocho docentes, cada uno de los cua-
observaciones ultenores de los efectos en varios momentos les interpretó cada método a su manera, en vez de utilizar
sucesivos. uno solo, o de hacer que los ocho memorizasen detalles co-
munes no incluidos en la descripción abstracta de los procedi-
mientos comparados. (Como •en Guetzkow y otros [1954],
Generalización a otras X: Variabilidad en la ejecución de X esa ejecución heterogénea de X debería complementarse, de ser
posible, con la práctica de que cada tratamiento lo ejecutara ca-
El objetivo de_ la ciencia comprende la generalización, no solo da uno de los participantes en el experimento, para que ningún
a otras po~lac1one~ )'. momentos eronológicos, sino también a elemento específico sin importancia se confundiera con un
representac10nes ~.hstmtas del mismo tratamiento, es decir, a tratamiento específico. A fin de poder estimar la significación
otras reprcse~tac1ones que en _teoría deberían ser idénticas, de la interacción maestro-método cuando se emplean cursos
p~r? que no 10 s?n en det_ermmados aspectos que, en prin- intactos, convendría que cada maestro aplicara dos veces cada
c1p10, carecen de importancia. Esta meta es contraria a la de método.)
mand_a de un mayor con trol experimental, que a menudo resul- En un ejemplo más sencillo, un estudio del efecto del sexo del
ta _e,v1dente ~ q_ue conduce al deseo de obtener en cada repe-- docente sobre los primeros pasos de instrucción aritmética
t1c1on una replica exacta de X. Así, al estudiar el efecto de debería utilizar no uno solo, sino muchos ejemplos de cada
una. apelación ~m~e~onal frente a otra raciona], y volviendo sexo. Aunque esta es una precaución obvia, no siempre se
al ,e1ernplo del m_d1v1duo que. hace declaraciones públicas, po- la ha respetado, como lo señala Hammond [ 19 54]. El pro-
d:ia!llos c<:mseguir que la misma persona se dirigiese a los blema constituye un aspecto de la insistencia de Brunswik
d1st1_n,ros ti¡_JOs de grupo empleando todos los grados de per- [1956] en el diseño representativo. Underwood [1957b,
sua_s1on pos~bles o, con mayor rigor todavía, grabar sus decla- págs. 281-87] ha sostenido, sobre fundamentos similares, una
ra~10nes a fm d~ que todos los públicos incluidos en un deter- posición contraria a la estandarización o réplica exacta de los
m~nado tratamiento oyesen «exactamente el mismo>> men- aparatos utilizados en los distintos estudios, de manera com-
saJe. Aparentemente, esto sería mejor que sí varias personas patible con su vigoroso operacionalismo.
hablasen una sola vez cada una en los distintos niveles de
persuasión, ya que en este caso «no sabríamos con exactitud»
gué estímulos experimentales se aplicaron en cada sesión

66 67
Generalización a otras X: Refinamiento secuencial de X 'V tema objeto de investigación por medio de pruebas consisten-
giupos de control noveles - tes en la redacci6n de ensayos habrá de efectuarse empleando
como vehículos la habilidad literaria y el uso del vocabulario
En cualquier experimento la X real es un complicado conjun- y, por lo tanto, deberá contener la variancia debida a esas
te~ ~e lo qne_ eventualmente se habrá de conceptualizar como fuentes que, con frecuencia, no son importantes para nuestros
c~1s!u1tas variables. Una vez detectado un efecto fuerte y de- fines. Dada esa complejidad inherente a cualquier O, nos
frn1do, el curso del proceso científico exige que se realicen encontramos con un problema cuando queremos generalizar
nuevos experimentos q~ie refinen la destacando bien los los resultados a otras O posibles. ¿A qué aspecto de nuestra
aspectos 111<ÍS esenciales al efecto. Ese refinamiento se loara- O experimental se debió aquel efecto internamente v:ílido?
rá por medio de tratamientos definidos y presentados en for- Como la finalidad de la enseñanza no es solo la de preparar
ma más panicular y concreta, o bien organizando nuevos individuos para futuros exámenes de ensayo y objetivos,
grupos de control, que igualen al grupo experimental en un debe tomarse siempre en cuenta ese problema de la validez
número cada vez mayor de aspectos del tratamiento redu- externa o la posibilidad de generalización.
ciendo diferencias a características más específica¡ de la Una vez más, desde el punto de vista conceptual, la solución
compleja X original. El grupo de control falso y el de control no está en confiar a ciegas en que se tendrán mediciones
con operación simulada que se utilizan en la investi<>ación mé- «puras» sin complejidades carentes de importancia, sino más
dica son ejemplos de ello. Los experimentos anterioies demos- bien en utilizar medidas múltiples en las cuales los medios y
traron un efecto internamente válido, pero que, no obstante, detalies específicos sin importancia sean todo lo diferentes
pudo haberse debido a que el paciente sabía que se lo sometía que sea posible, al paso que el contenido común que nos
al tratamiento, o bien al shock quirúrgico, y no a las propie- preocupa esté presente en todos y cada uno de ellos. Dentro
dades específicas de la droga o a la remoción del tejido ce- de un experimento aislado, es más lo que puede hacerse en
rebral: de ahí la introducción de los con troles especiales este sentido por las O que por las X, pues en un solo expe-
para prever esas posibilidades. La generalización a otras X es rimento se pueden lograr muchas mediciones de efecto ( es
un proceso exploratorio de extrapolaciones sugeridas por la decir, variables dependientes). En el estudio Guetzkow,
teo~·ía, pero sujetas a la experiencia, en cuyo transcurso es Kelly y McKeachie [ 1954], se notaron efectos no solo en los
posible que el mencionado refinamiento de X represente un exámenes regulares de curso y en pruebas ,c:,u..::,,rn1c:, de ac-
importante papel. titud introducidas a este fin, sino también en comportamien-
tos ulteriores, como la elección de carrera y la inscripción en
cursos superiores sobre el mismo tema. ( Aquellos compor-
Generaliz,tción a otras O tamientos resultaron de igual sensibilidad a las diferencias de
tratamiento que las mediciones del test.) Las O múltiples
Así como una X dada arrastra un bagaje de caracteres espe- deberían ser un requisito ortodoxo en cualquier estudio sobre
cíficos te6ricamente sin importancia, pero que pueden resultar métodos de enseñanza. En el plano más simple, deberían apli-
los causantes del efecto, así también cualquier O dada, cual- carse tanto exámenes objetivos como de ensayo [véanse Stan-
quier instrumento de medición, es un complejo en el cual el ley y Beeman, 1956], junto con índices de participación en
contenido correspondiente está necesariamente inserto en una clase, etc. (Una extensión de esta perspectiva a la cuestión
situación instrumental concreta, cuyos detalles son marginales de la validez de los tests se hallará en Campbell y Fiske
a la finalidad teórica. Así, cuando utilizamos lápices y plani- [1959] y Campbell [1960].)
llas de respuesta con calificación mecánica IBM solemos ha-
~erlo _ por razones de conveniencia y no porque queramos
mclmr en nuestros puntajes la variancia debida a la habilidad
los empleados, la familiaridad con el formulario del test
la exactitud en la observancia de las instrucciones, etc. Así~
mismo, nuestro examen de la competencia específica en un

68 69
5. Diseños cuasiexperimentales 1 acogerse a la práctica de métodos de investigación más infor-
males todavía. Además, esta larga lista de fuentes invali-
~ación podría, con mayor probabilidad aún, reducir la voluntad
de realizar los diseños cuasiexperimentales en que se advierta
desde un primer momento que se carece de pleno control ex-
perimental. Este resultado sería la antítesis de lo que nos ha-
bíamos propuesto.
pesde el punto de vista de su interpretación definitiva y del
mtento de adaptarlo al proceso evolutivo de la ciencia, todo
Son m~1chas la~ situaciones sociales en que el investigador experimento es imperfecto. Lo que puede lograr una lista de
puede mti:~ducir algo ~i1~ílar al diseño experimental en su verificación de criterios de validez es qu.e el experimentador
progr'.1mac10n ,de procedumentos para la recopilación de datos tenga más conciencia de las imperfecciones residuales que im-
(p. eJ., et cuando y el a quién de la medición), aunque ca- plica su diseño, para poder determinar en los puntos perti-
rezca _de control total acerca de b programación de estímulos nentes las distintas interpretaciones de sus datos. Por supues-
experim~ntales ( el cttá!ido y el a qttién de la exposición y to que debería diseñar el mejor experimento que la situación
1~ rnpac1dad de aleatorrzarla), que permite realizar un autén- permitiera, y buscar con el mayor empeño los laboratorios
t!co experimento: En general, tales situaciones pueden con- artificínles y naturales que ofrecieran las mejores oportuni-
s1?~rarse como diseños cuasiexperimentales. Uno de los pro- dades de control. Pero, además de todo ello, tendría que se-
i::osltos. de esta obra es inducir a que se utilicen estos cua- guir experimentando e interpretando con plena conciencia de
s~exp~nmentos y se aumente el conocimiento de los tipos de los puntos donde los resultados son aún equívocos. Esa con-
s1tuac1one~ en que se dan oportunidades para su empleo. c~encia es importante en los experimentos en que se ha ejer-
Pero pre:1samen~e J?Orque se carece de control experimental citado un control «total», pero es imprescindible en los di-
to_tal, es 1mprescmd1ble que el investigador tenga un conoci- seños cuasiexperimentales.
m1en_to _a fond? de cuáles son las variables específicas que En persecución de ese objetivo general, reseñaremos a esta
su diseno particular no controla. Por esa necesidad de eva- altura de nuestra obra las ventajas e inconvenientes de un con-
luar cuasiexperimentos, más que para satisfacer la de com- junto heterogéneo de diseños cuasiexperimentales, cada uno de
pren_der los exr:e!im~~tos propiamente dichos, se prepararon los cuales merece utilizarse allí donde no haJ1a otros mejores
las listas de vet1ficac1on de fuentes de invalidación en los cua- susceptibles de que se los aplique. Veremos primero tres di-
deos 1, 2 v 3. seños experimentales unigrupales. Después, cinco tipos gene-
El ~studía~te ? posil?l~ investigador medio que haya leído el rales de experimentos multigrc1pales. Una sección aparte se
capitulo antenor qu1za se encuentre con más problemas sin ocupará de la correlación, los diseños ex post facto, los estu-
reso!ver en el diseño de un experimento que los que había en panel y otros temas análogos.
con~1derado al_ con_iienzo que pudieran plantearse siquiera.
Sera P:1ra su bten .51 todo ello lo induce al diseño y ejecución
de me1ores exrenmentos y a una mayor circunspección al
e;-:traer conclusiones de los resultados obtenidos. Constituirá, Algunos comentarios preliminares sobre
sm embargo, un efecto secundario indeseable si crea en él b teoría de la experimentación
la sensación de desesperanza en cuanto al logro del control
experimental y lo induce a abandonar tales esfuerzos para Este capítulo está destinado en principio al experimentador
1_ Este capítul~i recurre en su mayor parte a D. T. Campbell, «Dise- que desee sacar sus investigaciones del laboratorio para tras-
nos cuas1expenmentales para su aplicaci6n en situaciones sociales na- ladarlas a la situación operativa. Sin embargo, los autores no
tmales» en D. T. Campbell, Experimentíng, validatíng, kno!l'Íng: pro- pueden dejar de reconocer que los psicólogos experimentales
blems of mcthod m tbe social scienu", 1\ueva York: McGraw-Hill quizá verán con suspicacia cualquier intento de recomenda-
en preparación. • ción de estudios en que el control experimental no· sea com-

70 71
pleto. En parte para justificar el presente trabajo ante esos a menudo por conveniencia al enunciar la hip~tesis de un
monitores, ofrecemos algunos comentarios generales acerca experimento, nunca puede ser «aceptada» en virtud de los
de la función de los experimentos en la ciencia, con la convic- datos obtenidos; cabe «rechazarla» o «no rechazarla».
ción de que son compatibles con la mayor parte de las mo- De igual modo, las hipótesis más g~ne~ales .d.e hecho nun~a
dernas teorías científicas que ellos fundan en la perspectiva se «confirman»· cuando por convemencta utilizamos ese ter-
de una posible psicología general de los procesos inductivos mino queremos' significar, más bien, que la hipótesis fue _ex-
[Campbell, 1959]. puesta a r~futación y salió ain:sa d~ ella. Este punto de_ v1s'.a
La ciencia, como otros procesos cognitivos, comprende h es compatible con todas las fdosofrns humanas de la ciencia
formulación de teorías, hipótesis, modelos, etc., así como la que proclaman la imposibílidad de obte_ner pru_ebas concluyen-
acept'.1ción o el rechazo de ellos en virtud de algún conjunto tes para leyes inductivas. En trabajos recientes, Hanson
de criterws externos. La experimentación pertenece a esa se- [1958] y P~)pper [1959] han sido taxativos a e.ste re?pe':t;>,
gunda fase, la del dcsbroz,1miento, el rccha:,,;o v la revisión. Muchos conjuntos de datos recopilados en la mvest1gac1on
Podernos suponer para nuestra ciencia una ecología en la cual educacional tienen poco o ningún valor indagatorio, y muchos
el número de posiblc:s hipótesis positivas exceda en mucho al grupos de hipótesis son tan intrincados que no se los. pued~
de las hipótesis que a la Lirga demostrarán ser compatibles confirmar por medio de los mecanismos de sondeo dt~~om-
con nuestras observaciones. La rnractcrística predominante bles. No deseamos en modo alguno acrecentar la aceptab1l1dad
de la tarea de compilación de datos para la prueba de teorías de esa seudoinvestigación. Creemos que los diseños de inves-
es, pues, el rechazo de hipótesis inadecuadas. Para conseguír- tigación que estudiamos más adelante son, sin em~~rgo, 1~
lo resulta provechoso cualquier ordenamiento de observacio- bastante indagatorios para merecer :iue se los .ut1hc; all!
nes .en virtud del cual se desautorice la teoría correspondien- donde no se disponga de otros medios de estudio mas efi-
te, rncluycndo diseños cuasiexperimenta les de menor cfica::ía caces.
que los verdaderos experimentos. Aunque correcta, la idea de que los experimentos jam~s «con-
Cabe preguntarse, sin embargo, si tales diseños imperfectos firman» la teoría contradice de tal forma nuestras actitudes Y
no vendrán a confirmar con falsedad una teoría inadecuada experiencias como científicos que nos resulta casi intolerable.
descarriando del bu.en camino los siguientes esfuerzos v des~ En particular, ese énfasis i::arece_ poco acept~ble frent~ _a las
perdiciando el espacio de nuestras publicaciones con las doce- ruidosas y llamativas confirmaciones obtemdas en f1s1ca y
nas de estudios que parecen necesitarse para desarraigar un química, donde los trabajos de experimentación pued~n- _ajus-
falso positivo de notable divulgación. Es este un grave riesgo, tarse con minuciosidad, sobre muchos puntos de med1c1on, a
que, no obstante, debemos encarar, y del cual participan -en una compleja curva prevista por la .teoría. Y para la ~ayoría
esencia, ya que no en grado-• los «verdaderos» experimentos de nosotros la perspectiva se torna maceptable, en sentido fe-
de los diseños 4, 5 y 6. En un sentido muy fundamental, los nomenolócrico cuando se la extiende a las conclusiones induc-
resultados experimentales nunca «confirman» ni «demues- tivas de h1 visión. Resulta, por ejemplo, difícil comprender
tran» una teoría: más bien, la teoría triunfante está probada que las mesas y sillas que <<vemos,> ~nte _nos?tros 1:º sean
y escapa a la refutación. La palabra «demostrar», a menudo «confirmadas» o «aprobadas» por la ev1denc1a v1Sual, smo que
empleada para designar la validez deductiva, ha adquirido en consistan en «meras» hipótesis sobre objetos externos aún no
nuestra generación un significado impropio, tanto respecto desautorizadas por las múltiples indagaciones del sistema óp-
de sus anteriores aplicaciones como a su utí!ización actual en tico. Hay algo de razón en ese rechazo. . .,
procedimientos inductivos, como la experimentación científica. Se confiere a una teoría diversos grados de «conf irmaciom> a
Los resultados de un experimento «ponen a prueba» pero no tenor de la mavor o menor cantidad de hipótesis rivales acep-
«prueban» una teoría. Una hipótesis bien fundada es aquella tables de que ;e dispone para explicar la información. Cuanto
que ha sobrevivido en reiteradas ocasiones a esos exámenes, menos hipótesis rivales queden, mayor será el grado de «con-
pero que siempre puede ser desplazada por otra nueva inves- firmación». Es de presumir que en cualquier etapa de la. re-
tigación. copílación de datos, aun para la más avanzada de las cien-
En la actualidad se entiende que la «hipótesis nula>,, utilizada cias, hay muchas teorías compatibles con la información, en

72 73
espe~ial sí se c?nsideran t0<las las teorías que abarcan circuns- de variables no controladas, una para cada diferencia obser-
tancias c01_nple¡as. Sin embargo, en Ia práctica se dispone de vada, entonces el efecto de X viene a ser el más defendible.
pocas te_onas -cuando las hay- que hagan frente a las «bien Es frecuente recurrir a este modo de inferencia cuando los
e~tablectdas». o a las que han sido verificadas a fondo me- científicos tienen que limitarse a resumir literatura por carecer
diante compltcacl?s ~periment:)s; tampoco se proponen seria- de experimentos pei-fecrnmente controlados. Así, Watson
m~nte es~s. teorias r1v!les. ~1cha ~s~asez es el equivalente [1959, pág. 296] halló confirmatoria la evidencia de los efec-
ep1stemolog1co de la ~1rmac1011 positiva de fo teorfa que pa- tos nocivos de la privación materna, porque se la ve confir-
rec~n ofrecer los experimentos espectaculares. Una escasez se- mada por una amplia variedad de datos, cuyas insuficiencias
•~e¡ante de hipótesis rivales se da en el conocimiento fenomé- específicas varían de unos estudios a otros. A su vez, Glickman
n_tcamente pc:s(tjvo que por co!1traste parece ofrecer, por [ 1961], a pesar de la presencia de hipótesis rivales sostenibles
eJe~p]o: l~ v1s1?n a la comparativa ambigüednd de la explo- en cada uno de los estudios, consideró importantes las prue-
rac1on tactd a ciegas. bas de un proceso de consolidación sólo porque la hipótesis
Dentro de esta perspectiva, la lista de fuentes de invalidación rival sostenible variaba de un estudio a otro. Esta forma de
gue controlan los diseños experimentales puede considerarse inducción lógica, adoptada por Jo común en la -combinación de
c~m10 una enu~~rac~ón de hipótesis -a menudo aceptables~- inferencias de distintos estudios, se introduce deliberadamen-
r;vales de la h1potes1s de que la variable experimental ha sur- te dentro de ciertos diseños cuasiexperimentales, en especial
tido un efecto. Donde un dísefio experimental <icontrola» uno los «remendados», como el 15.
~e esos factores, se Iimi~a a hacer insostenible esta hipótesis El recurrir a la economía no se justifica desde el punto de
rival:. aun cu_an_do, en virtud tal vez de complicadas coinci- vista deductivo, sino que constituye más bien un supuesto
dencias, cont:lm!e op~ran?o para producir el resultado experi- general acerca de la naturaleza del mundo, que fundamenta
mental. 1:as <:hip6tests rtvales aceptables» que han requerido casi toda aplicación de la teoría en la ciencia, por más que
el uso mtmano de grupos especiales de control actúan a modo en aplicaciones particulares resulte a menudo errónea. En reia-
de leyes ~mpíricas bien establecidas: por ejemplo, los efectos ción con esta observación hay otro argumento de admisibílidad,
d~ l: practica par~ ~l. agregado de un grupo de control al que invocaremos acaso más en detalle a propósito del muy
diseno 2,_ J~ s~1gest161hdad para el falso grupo de control, el utilizado diseño 1O ( un buen diseño cuasiexperimental, que
shock_ q:uru_rg1~0 para el control con operación simulada, etc. a menudo se confunde con el verdadero diseño 4). Es la pre-
La~ hipotes1s rivales son creíbles en la medida en que pueda sunción de que, en casos de ignorancia, el efecto principal
atribt:Irseles categoría de leyes empíricas. Cuando en un cuasi- de una variable debe juzgarse más probable que la interacción
expenmento se c,:rece de controles, al interpretar los resulta- de otras dos variables; o que, en general, los efectos princi-
dos hay que considerar bien la posibilidad de que tales resul- pales son más probables que las interacciones. En su máxima
ta~o~ obedezcan a factores no tomados en cuenta. Cuanto expresión, cabe señalar que si cada interacción de orden su-
ma~ improbable sea esta posibilidad, más «válido» será el ex- perior es sígníficativa y cada efecto es específico de determi-
perimento. nados valores en todas las demás dimensiones posibles de tra-
Como lo señalamos al exponer el diseño de cuatro gnipos tamiento, ya no hay lugar para la ciencia. Si podemos ge-
de Solomon, cuanto más numerosas e independientes sean las neralizar alguna vez, es porque podemos hacer caso omiso de
formas en que se demuestra el efecto experimental, menos nu- un gran cúmulo de factores potenciales determinantes.
!nero!as y probables se tornan todas las demás hipótesis rivales Esto fue denominado por Underwood [1957b, p,íg. 6] «su-
rnvali?antes. S~ apela entonces a la economía. La «validez» del puesto de causación finita». En otro lugar [ 1954], el mismo
expen~ent~ viene a ser, pues, la de la admisibilidad relativa de autor ha registrado la frecuencia de efectos principales y
las teor1as rivales: la teoría de que X tuvo un efecto frente a de interacciones en el Journal of Experimental Ps)1chology,
las teorías de causación que comprenden los factores no con- confirmando la relativa escasez de interacciones significativas
t~olados: Si cabe explicar la totalidad de varios conjuntos de (aunque las correcciones introducidas por el editor, tendientes
diferencias por la hipótesis única de que X tiene un efecto a presentar resultados claros, nos hacen dudar de este ha-
al paso que es necesario hipotetizar varios efectos separado~ llazgo).

74 75
En los p:írrafos siguientes expondremos primero los experi-
riado durante muchos meses se sumerge y retira de un baño
mentos con un solo grupo. Desde 1920, por lo menos, el di- de ácido nítrico, la deducción que relacionaría esta operación
seño experimental predominante en psicología y educación con la pérdida de peso de la barra seguiría alguna lógica e_x-
ha sido el de grupo de co11trol, como el 4, 6 o, acaso más
perimental de esta índole. Por supuesto,_ pueden haber _exis-
a menudo aún, c:l disc110 10, que veremos más adelante. En tido «grupos de control» de barras de hierro ql:e. :'e d~¡aron
bs ciencias sociales, y consiclernndo situaciones sobre el te- en los estantes y no perdieron peso, pc:ro la rnedic10n e rnfor-
rreno, los diseños de grupo de conaol han predominado a
maci<Ín de esos pesos constituiría un caso típico c:n el cual no
tal pnnto que parn :ilgunos son sinónimo de experimen-
se la consideraría ni necesaria ni pertinente. Parece, pues,
taci<ín. A consecit.cticia de ello nrnchos investigadores llegan
probable que ese ?isc:fio e:'p?r\men'.al _se considere a menudo
a abandonar todo intl'llto <k l'xpcrimentaci(in en sitnaciones
válido en las ciencias ele mas exllo, si bien rara vez se lo acepte
en las cuales no se disponga dl' grupos de co11trol, terminando
en las enumeraciones de dise11os experimentales disponibles
así como una imprecisilín i1rncn-s:iria. Fn realidad, varios di-
en las ciencias sociales. [Véase:, sin embargo, Maxwell, 1958;
seños cnasiexperimentalcs aplirnhlcs a grupos aislados podrían
Underwood, 1957b, pág. 133. l Hay buenas razones que jus-
empicarse provechosamente, y seg11ir los c:ínoncs lógicos e in-
tifican esa diferencia de categorías, y una cuidadosa conside-
terpretativos experimentales, en nrnclms c:isos en que es impo-
ración de ellas ofrecerá una mejor comprensión de las condi-
sible el disefio con grupo de rnnt rol. La coopcr:ici<Ín y la
ciones en que los científicos sociales podrían emplear con pro-
posibilidad de cxpcriment:ir se dan a menudo en unidades ad-
vecho el diseño cuando no hay modo de utilizar un control
ministrativas naturales: una rn:1estra dispone de su clase; el experimental más preciso. El diseño es típico de los experi-
director de una escuel:1 scrnnd:uia tal vez esté dispuesto a mentos clásicos del British Industrial Fatigue Rc:search Board
realizar encuestas pcricídic1s sohre el cst:1do de :ínimo de los sobre foctores que influyen en la producción industrial [ p.
alumnos, etc. En tales situaciones el tratamiento diferencial ej., Farmer, Brooks y Chambers, 1923).
de segmentos dentro de la unidad adrninistr:1tiva ( requerido La figura 3 indica algunas posibles situ~ci?nes res'.1ltantes en
para el experimento con grupo de control) qu.iz:í resulte im- series cronológicas en las cuales se habrn 111Lroduc1do una al-
posible en sentido administrativo o, aun cuando ello no ocu- teraci<ín experimental, según se indica por medio de la línea
rra, sea indeseable como experimento a causa de: los efectos vertical X. Supongamos, a los fines de este estudio, que sen-
re:ictivos ele los dispositivos·. P:1ra situaciones de esta índole tirnos la tentación de deducir que X tuvo algún efecto en las
bien podrí:111 :1doptarse experimentos con un grupo único. series cronológicas con resultados corno A y B, y quizá C,
D y E, pero no un efecto en las series éronológicas tal como
F, G y H, aunque el salto de valores d,e ?4 a Ür; fu~se tan
7. Experimento de senes cronológicas grande y desde el punto de vista estad1st1co tan persistente
como, por ejemplo, las diferencias o~ a Ür; en 11 y B. A~n9ue
dejaremos el análisis del problema de Lis pruebas estad1sticas
El disefio de series cronológicas consiste, en lo esencial, en
un proceso periódico de medición sobre algún grupo o indi- para algunas páginas más adc:lan te, se su l?º.n~ que el pro~l,e-
ma de la validez interna se: reduce en dc:f1111t1va a la cuest10n
viduo y la introducción de una variación experimental en esa
de hipótesis competitivas aceptables que ofrezcan otras ex-
serie cronológica de mediciones, cuvos resultados se indican
plicaciones probables, distintas del efecto de X, acerca del
por medio de una discontinuidad en las mediciones registra-
desplazamiento en las series cronológicas. Ofrecernos en el cua-
das c:n Li serie. Se lo puede diagramar ele la manera siguiente:
dro 2 un intento de lista de comprobación de los controles
suministrados por este c:xperirnen to en las mencionadas con-
diciones óptimas de resultado. Las ventajas del diseño de se-
ries cronológicas resu !tan muy evidentes en contraste con el
Este diseño experimental tipificó gran parte de la experi-
diseño 2 con el que guarda una similitud superficial, ya que
mentación clásica del siglo x1x en las ciencias físicas y bioló-
carece d~ grupo de control y utiliza mediciones previas y pos-
gicas. Por ejemplo, si una barra de hierro cuyo peso no ha va-
teriores.

7(-,
77
FiguL, 3. Posihles con!iguracín11cs de !os resw'tLidos de ÍJ1lm- (';bservanclo en el c1rndro 2 la lísu ele prohlema,, de validez
iÍrtch· U:'/d t'uT/ :/Jlc C.\ :·;·Ín;c,1,1/ <'il {.¡ r)Jl ////:_-' scr1i...:'
'1tcrna, vc,iris qu,· Lt i111¡,,,sil1ili,L1,l de c,mtrobr L1 hist,,ri:1
cro;;,;f,;giw de 111c1.liuo11cs 1 O., ()"· Oi d casu U, la
es el más grave ÍIKrmvcnicnte del diseño 7. Es decir que exi',-
di/crc·J/,__·ia ().1¡ - (),.-; es / J!lÍSJ/!~:' /Júra toJas las series cronoló- te la bipóresis rival de qn,: no se,1 X sino utro acontecimiento
r~itnr. C!l hlnfn qtl( [;":' i-{--1d d ( ir.,fcr/r :r'l ('l{'Clo r·arid
rn,;s " 11ll'li<JS si,r111lLÍ11,.•¡¡ el qrtc ,,n1v11u··, el ,Je:;¡,l,tz:1micnto.
n/ach/; ~1"icnd(i _!/Ju':\·11,1,-\,- t'// il y lJ y /1.1!:.dn1ci1.'/,,-· iu¡usii/ic1.1d¿¿ '.)d,re In admisibilidad de elimin,1r tales ,:stímui<>,, externos
C/1 F, (, y Ff.
debe ha,;arsc en t,)dos ll''; casos la conlil!lza Lk:pusitada en
Li ínié'rpru:ici6n ,le e-si-e l'Xperinic·nto. Í\1ulícTlll<h t111 cxpc-
ri'11c11t,J qu,. • cxij,1 u1cdici,1:1cs rcít,. ,rad:1s v ,.:! ,Jc,lu que un
fílme documental produce sobre el uptimhmo o pl'simisrno de
A les alnmnn., con relación J la pruli:ibilicbd Lle que estalle o no
,_, ,:1 gu,:n.r_ En 1;il c1sn. 11" s1m1í 1istr,1r 1:n C<J11tr,il ,kfii,idu

sobre la historia p:1recería sin dmh muy gr:ivc, ya que es ob-


Yio que los estudiantes esLÍn todos los días expuestos a mul-
ti t 11d de: frwntr·s ék ,·,;(Í1,1:do ,·11 ,·se rnis11•,1 sentí.io, ,Hlc::,:Í,;
de las c¡uc: 1nancj:1 el cxpcriment,1d¡1r en el :rnla. Pur supuesto
que, aun :,sí, si el experirncnto se complementara con un cuid:1-
doso rcgic;rro de estímulo., no ex¡)("rimenLiles de ;1]g1ma n:'k-
,-:mcL1, :,nía qui/:is accpuLk 1111:i Ílll\'.t:¡ 'l:lci(m :-",r Ja cuJI
se ju.stifirnra llevarlo a c1ho. Como ya hemos dicho, la va-
riable historia es la conLr:1part ída de lo que en el hboratorio
L éi,í,·o v í,iolii,.;i,,, lu ,i,í,, d,·11< :1¡Í11:1,l,J 1r!{1111i, ;:.'o ,
,'I
I
mental. La ad~nisibilidad lÍC lrr /Ji\'loría como ex¡,licación de
'
dcc;pfozamicntos del tipo de los verificados en las o,ries crono-
n
J,<,¡,i,·:1s ,.1 V ,Je. l.1 fi,;(li''.i ) d,·pc11,k, l:'11 !'/:111 p;ttlc', d,, fa illl'-
d1da del :,íslamic.110 cxpcr:1rn.:nt.1l qw.: pueda cuu,,q·,UH d cx.-
pcrimentadot. Lu, estudios sobre reflejos condici,m,tdos r,,a-
'íí,:1dos p,n- Pavlov con perros, v l'l!C eran r:n defi11iiiva l::.11c-
,-:1nc11tll, ,le- <rn11 ¡!1'11\J!'.b ,, ,rnn ,l!11111;il». h,,bicsc11 -id,, 1111:,i><l
menos admisibles como fundamento lle Lis tcorÍ:ls del s,1bio
Tuso sí, en vez de haberlos dectt1:td,) en w1 hiburat,n-io alcj,l(io
de ((Id,, 111íd11, l,_,c; pr:1cíí,.::1d,1 ,:11 c11,1'qt1Í,:1· ,..:.-,q11í,,1
de la cíu,bd. Que es lo q_uc constiwyc un ,rislamiu,lo experi-
mental vnría con el problenrn qnc' ·,e estudia y el tí po de ele-
1nc111,1s de n)cdicí,1:1 qtie ,,, 111í)i:,::rn. Se exigen, si11 d1Hb, mis
rire.c,u.1ci,i:ies para cstahkccr el ,1i,L1111iu1,,1 cxpcTi'.•H:ntal 1,,:-
cesario cuando se han de c'Stu.dL1r partículas subtómicas en
c,ímara de niebla 1) con un con1,1<lor de centelleo. que para
1·1 c'X\"···1;1m·11t1, hipoll;li,,.1 ,1,-,Tc:1 del ¡)e," ,le L1:-: h,1rr:l" de
hierro b,1i1:1das en ácido nitrico. En much,1s sÍtll aciones que
pennitirfan utilizar el diseño 7, sería admisible que el ex-
( j, (i. (), ( ); pni111cnt:His1r Sllotuvíc,e h.ilwr tr,1h:ií,1dn L'tl ,·ornlicioncs de
:1i,lamiento experimental, si tuvo conciencia de los posibles
acontecimientos rivales h1111bién capaces de producir el cc1m-

78
Cuadro 2. Fuentes de invalid,h·ión parc1 los tfr cños ¡ a l2. bic,. y pudo descarur con s1 tfiden k kígicn L1 proh,1hilidacl de
que c,t,is \'dti111":; 1,, cxplicn,1n.
Entre otLh vmiahles cxtern,1s que·. por rnzones de convenien-
podrían incluirse en ,·I foctor histori,, están los efectos
rn,·tc"r,,kw_íL·,1:;. J.c'" ,·::¡11·11111c111,,,; ,L ,·,;¡ í:1,lolc f ¡,. l'J.,
estudios :;obre rcndimic11tn labora!) tal vez se prolonguc!i
dur:mte L1p,;os que ,ibarquu1 camhius eshFinnnles. v entonces
las flucl11:1cilllli'S ,·,t:1ci"11,1\·; c11 il· rninaci,,11, Cllll(.li;·inrws mc-
1.'lc., l"li'¡l,11 ,·111ilu11d11 l\Jll ];¡ 1111 r,,ducció11 ele
variaciones cxperirncnt:1lc,. Quizá fuera incluir en ia
historia, :-<,m en ci,-rto sentido an:ílogos a Li madura-
f )!r1·i,•u.J . lo;; 1i,:111ns :" rii'H 11c,,,. el,· l:1:, ;1s
1)tu1sicxp 1 • r ir,, 1'?ti.al r:s tdcridns 11 las co,tumbrcs· inslituci,nalcs ,le-! los
1. Scrk,
cron,;l,Jtticas cicl,,s sern:lllales de trabajo v de de s,;
o o o o\'.'o o o , , de c·,·.;51nc11,_,, V v;1c:1cii.:);1C:<, \' !;1_:) í s·:-.,ln:--,
,~. I'l1;;:•1·1r1 de
1n111·.'>tr:1s de obscrv:1ciuÍ1es dc·bc1ía1: u1dc1ur,(1 de Lli ma1,,Ta que se
cnm¡)¡,·}~l('as
('(J ni v:d ~'lites
m:mtuvicr;1n const:mtcs lo,; ciclos o de ln contrario
X,O X.,o X,O
X,,(!, <"!,·.
ser Jo bastr1te pr"long,1d:1~ como 17:ir:1 inci •r en s11 totalidad
9. nis,·n,;: de VJr:ns 1k e: os cic\ ,;;,
1n11e:,tr:1.,s
mati-ri;tl<·s
Cuntínucmos con lus factores que hay qu,_· controhr: In m+
eqniv:,it·ntc!. dur,1cüí11 pnrece q11cdar climinach sLlbre la hase de que, sí el
M.,Xp ,\f,,.Y.,(l
M,.x,u re,:il1;1tlo c1.1rn,, l,is de i-. cj,·m¡,':,,s A v !l de 1:i figurn 3,
:H,1Xi/ >, ;_<f<•. ella no ofrece de ordinario hipók,is rívalcs acepubles para
] O. Dísn,,, de
gnip,· de cont:;\)
+ + explicar ;: de,pbznmicnto producido ern re O, v Ür; qtw
nd Cfltiiv;1knh-·
n0 se Ji:il,í1 cl:ido , 11 los :ntcriorcs •1c:río¡bs ,1!1scrv;id¡1s. (Nn
() ()
() () ob,rn11t1:, Li rn,1dur;tción no siempre: es u11iformc y rcg11br.
Nótese c0mo 1a ~lÍbita iniciación de las menstruaciones en
+ ahrnnas dc- 1 primer año de la esc1ela secundaria podría
Y,O Y.11 .\// 1! rcc,:r ,.·n t111 disc(1() 7 CIHlH' un electo del c1mhiu c:1::
X,O X,n - .Y,O o sobre los fisiológicos. si no supié-semos que no era
_x,,o x,o x.o .Y , • así.) Asiiní,1110, L1 aplicación de tests parece, en general, hi-
X,O X,O Y.O X,r>
p,,1,·:;is ri\' 1, n,1 ,·1Tíhlc p::u 1111 sJ'.tll entre () 1 v O,. Si s,, 1ll
J-J !Jiscll(; de
n111c:,tra + + tuviérnmo, las observaciones en O, v Ür,, como en el diseño
sepaLH1,i 2, carecerí:imos de ese medio de con;ertir en inaceptables íos
prctt':-t-postest
H O (X;
dcctr>s lle madnr:ici,ín v ]ns te ,1s rcrcst,. T\t,1 ,'.s b ¡;r:m vcc1
0

n "X U taía dd disd'io 7 ~ubr~ el disd'iu 2.


J 2.a D~ igual modo, muchas hinótesis que invocarían variaciones
H o 1x·, + en la instrumentación carecerían de base raciom1l específica
¡¡ X¡¡
p:·.u ,upn,,,T qul' en aqucll:i <>Cloicí11 p:irti,.ubr, ;1 difcr¡•ncia
H O
H o de otras anteriores, se había producido el error de los aparn-
1:lb tos de medición. Nn obst:inte, el signo de interrogación en el
-t-
¡¡ (), (X'.1 c,udro 2 !Ltma b ,1tenci0n 1·econl111do Lis pcisihk,, sítr1:1cic,-
H U,(Xi nes t.'.11 que un cambio en la calibución del instrumento de
H X O,
medición p,,drfa dar lugar a que se lo interpretase como efcc-
12c +
!/ li. X ().,
n \ o;
81
t~> de X. Si el procedimiento de medícíón implica las aprccia- de la variable experimental a esa muestra específica, así como
c'.oncs Je observadores .humanos conocedores del plan expe- a la posibilidad de que esa reacción no fuese típica de algún
nmt::ntal, puede prodncnse una seudoconfírmación de la hi- uníverso de interés más general, con respecto al cual el grupo
pÓ¡:csis a causa de las expectativas del observador. Así, el expuesto, constituido naturalmente, sea una muestra sesgada.
cnmbío. ~xperímental Je pon~r en posesión de su cargo un a Por ejemplo, la necesidad de datos puede limitarnos a aquellos
alumnos que han tenido asistencia perfecta durante largos pe-
nuevo director puede producir una vatiación en las estadísti-
cas de foltas dísciplinari,1s, en vez de inflnir sobre la tasa de ríodo:<: un evidente subconjunto selecto. Además, si se han
infracciones como tal. A menudo puede emplearse el diseño utilizado O nuev:1s, ese reiterado acontecimiento puede haber
7 pc1ra medir los efectos de un imporunte cambio introducido provocado au.sentisrno,
en la política :tdministrativa. Teniendo esto en cuenta con- Para que estas series cronológicas se interpreten como experi-
vendría evitar el cambio de instrumentos de medició~ a la mentos, es imprescindible que el experimentador especifique
vez que se modifica la política. E11 la mayor parte de los n1sos de antemano la relnción cronológica esperada entre la intro-
serfo preferible, a fin de prescrv:\r la intcrprctahilidad de rnw duu:ión de !a variable experimental y la manifestación de un
seri_e cronológica, continuar cmph:ando dispositivos un tanto efecto. Si se lo hubiese hecho así, 1a situación indicada en la
anticuados, en vez de :;nstituirlos por otrus rnt1s modernos serie cronológica D de fo figura 3 podría ser tan concluyente
pero distintos, como la ele A. Las encuestas exploratorias que decidiesen se-
Los efectos de la ref!,resión suelen consistir en lm,1 función gún las cü-cunstancias sobre las interpretaciones de efecto
negativamente acelerada del tiempo trascurrido, tazón por Jifcriclo, requerirían una validación cruzada antes de que fue-
la cual no son aceptables como explicaciones de un decto en ran interpre-tables, A medida que aumenta el lapso trascurri-
Or. mayor que efectos en o~, 0:1 y O.,. La sclcccir;n corno do entre X v el efecto, aumenta asimismo la admisibilidad de
fuente de efectos principales se elimina tanto en este diseño los efectos resultantes de acontecimientos hist6i:icos externos.
como en el 2, si en to&1s las O están implicadas las mismas También parece imprescindible que se especifique la X antes
personas. Si en un determinado grupo los datos se recopilan de examinar el resultado de la serie cronológica. El examen
sobre la base de sus integrantes individuales, se puede elimi- post boc de una serie cronológica para inferir cuál fue la X
nar la mortalidad en ese experimento lo mismo que en el que precedió al desplazamiento más notable tiene que des-
diseño 2. No obstante, si las observ;1dones se refieren a d;1tos cartarse, a causa de que el aprovechamiento oportunista del
cok:ctivos, h,1hrfa que llewr un registro del ausentisrno, las azar que él permite dificulta, y hasta imposibilita, cualquier
renuncias y fas reposiciones, a fin de asegurarse de que las intento de comprobar la significación de los efectos,
coincidencias de cambios de pcr,onal no ofrezcan hipótesis ri- L1 preponderancia de este diseño en las ciencias más prcís-
vales aceptables, - perns debería hacernos sentir algún respeto por él; recuérdese,
En cuanto a la v;1lidez externa, está claro que el decto expe- sin cmb11rgo, que los aspectos de «aislamiento experimental»
rimental bien podría ser específico para las poblaciones s~je- y las «condiciones constantes» lo hacen más interpretable pa-
tas a reiteración de pruebas. Es improbable que ello consti- ra ellos que para nosotros, Recuérdese, asimismo, que en el
tuya una limitación a la investigación sobre 1:t enseñanza en uso que suele hacerse de él, un experirof:nto único jamás es
establecimientos escolare,s, a menos que el experimento se concluyente. Aunque puede ocurrir que no se utilice un grupo
realice con O artificiales no comunes en la situación escoL1r de control, antes de establecer un principio es menester que
habitual. Adem,ís, este diseño es de particular aplicaci6n en las varios investigadores repitan el diseño 7 en muchos lugares
situaciones i~stitucíonales en que se llevan registros regula- distintos. Tal debería ser, asimismo, la aplicación que noso-
res que constJtnyen, por tanto, pnrtc natural del ambiente en tros le diéramos a este diseño, Deberíamos utilizarlo allí
que se realiza el experimento, Las prc1ebas anuales de cali- donde no se pueda hacer n{{da mejor controlado. Organizare-
ficación en las escuelas públicas, los registros de enfermedad, mos nuestra contabilidad institucional de tal modo que nos
etc., no son por lo común reactivos, puesto que son típicos suministre el mayor número posible de series cronológicas
del universo :ti cual se quiere hacer la generalización, La in- para dichas evaluaciones, y trataremos de examinar con mayor
teracción selección-X se refiere a la restrkcic'.m de los efectos cuidado que hasta entonces los efectos de los cambios admi-

82 8_3
nistrativos y otros acontec1m1entos súbitos y arbitrarios co vaciones pre-X y post-X resulta inadecuada, pues no distin-
mo X. Pero no los consideraremos definitivos hasta haberlos guiría entre casos del tipo F y casos del tipo A.
repetido una y otra vez en situaciones diversas. En el desarrollo de un test de significación suele haber una
enojosa falta de indepe11de11cia. Si tal carencia estuviese dis,
tribuida en forma homogénea entre todas las observaciones,
Tests de significación para el díseifo tlc serie cronoló,gica ella dejaría de constituir una amenaza para la validez interna,
aunqw.: fuera una limitación a la validez externa. Lo que sí
Si las ciencias más avnnzadas no empbm t,mtos tests de resulta inoportuno es que en casi todas las series cronológicas
nificación como la psícologfa la pedagogía es, sin duda, por- se eucontraní que las obscrvacio11es adyacentes son más si-
que !a magnitud y claridad los dccros con gue trabajan milares que las no ,1dyaccntes (es decir, que la m1tocorrc!a-
son tales que los hacen innecesarios. Si se ;1plirnse en ellas ción del defosaje 1 es mayor que la del 2, etc.). Así, una m-
nuestros tests lwbitualcs de significación, se desculirirían tam- fluencía o perturbación aleatoria externa que influya sobre
bién allí elevados índices de este factor. P,1rece, sin embargo, un punto de observación, por ejemplo, en 0:; n O,;, también
típico de la ecología de las ciencias sociales tener que trabajar alterad 07 y Os, por lo cual no se las puede tratar como
con minerales pobres, para los que no son necesarias las prue- varías desviaciones independientes de la extrapolación de la
bas de significación. También es probable que allí donde tendencia 01 01.
el sentido común o las apreciaciones intuitivas scfialcn con El test de significación utilizado dependerá en parte de la
claridad un efecto resu !te po,ible, por lo común, alguna prue- índole hipotética del efecto de X. Si está implicado un mo-
ba de significación que ratit:k¡ue las consideraciones en que se delo como la línea B, se podría utilizar una prueba de la des-
funda el juicio intuitivo. Así, se pueden t1plícar pruebas de viación de Or; respecto de la extrapolación de 01 - 0.1. Mood
significación sobre los efectos de X que distinguirían entre los [1950, págs. 297-98] ofrece una prueba de esta índole. Ese
vados que ilustra la figura 3, juzgando que A y B test podría emplearse en todos los c,1.sos, pero parecería inne-
son significativos y que F y G no lo son. Veamos algunos cesariamente insu.ficiente si se supone una mejoría cons-
posibles enfoques. tante o un mayor índice de ganancia. Para esos casos, sería
Ante debemos rechazar, por inadecuados, ciertos trnta- aconsejable una prueba que emplease todos los puntos. Son
mientos imaginables. Si la información recogida en la figura 3 dos los componentes que constituirían tales pruebas de sig-
representa medias grupales, será insuficiente una simple prueba níticación: la intersección y la pencfü~11te. Por intersecci6n
de significación de la diferencia entre las observaciones de queremos signíficar el salto en la serie cronokígíca en el p11n-
0.1 y o~. Aunque en las series P y G estas suministrasen rela- to X (o en ,1lgún desplazamiento especificado despu(>s de X).
ciones t de elevada significación, no podríamos que los Así lHs líneas A y C indican un desplnamiento ele intersec-
datos demostraban el efecto ele X a causa de la presencia de ción sin variación en la pendiente. La línea /; il11sírn nn cam-
otros desplazamientos significativos similares, que a veces ocu- bio en la pendiente pero no en la intersección, ya qne coin-
rren, y para los cuales no tendríamos explicación experimental ciden las extrapolaciones pre-X a X y post-X a X. A mcnurlo
alguna que les correspondiese. Cuando se trabaja con la infor- ambas se cortan, y la pendiente quedaría modificada por una
mación obtenida de encuestas nacionales de opinión, suelen X efectiva. Podría conseguirse una prueba pnra de intersec-
encontrnrse desplazamientos muy significativos entre una y ción en forma análoga a la aplicación de una prueba Mood
otra consulta que, desde el punto de vista del científico en- desde una v otra dirección a la vez. En este caso estarían im-
cargado ele las interpretaciones, no wn más que «ruidos» plicados d¿s puntos extrapolados, con observaciones pre y
aleatorios, ya que constituyen una parte de la variación en los X extrapoladas a un punto X intermedio entre 01 y O,,.
fenómenos para la que se carece explicación. A fin de pruebas estadísticas casi con seguridad comprenderían,
que sea interpretable, el efecto de un bien perfilado aconteci- en todas ias series cronológicas ( con excepción de las más ex-
miento o variable experimental debe trascender ese nivel tensas) ajustes lineales a los datos, tanto por conveniencia
ordinario de desplazamiento. Asimismo, una prueba de signi- como porqu.e un ajuste más exacto agotaría los grados de li-
ficación que abarque los datos combinados de todas las obser- bertad, no dejando oportunidad alguna para verificar la hipó-

84 85
tesis de cambio. Sin embargo, en muchos casos la presunc1on un espaciamiento temporal constante, sobre todo cuando pue-
de linealidad puede no ser correcta. La admisibilidad <le inferir den introducir un elemento de confusión con un ciclo diario,
un efecto ele X es mayor en un punto próximo a X. Cuanto semanal o mensual, o cuando a causa de la periodicidad pre-
más gradual o más tento sea el efecto supuesto, más grave será decible, un condicio11amie11L(1 indeseable al intervalo tempo-
la conrusión con la historia, ya que aumenta el número <le ral puede intensificar la diferencia entre las distintas presen-
posihks causas externas. taciones. Así, Sorokin se aseguréí de que cada tratamiento ex-
perimental se reali'.1.ara con idéntica frecuencia de mañana y
de t,1rde.
Casi todos los experimentos con este discíío han empleado en
8. Diseño de muestras cronológicas equivalentes proporción poc:1s rcpcticiones de rnda concliciLÍ11 L·xpcrirncntal,
pero una extensión dL: l:1 teoría (kl m11cs11-co colllo h represen-
La forma más común de diseño experimental utiliza una tada por Brunswik L19561 sc11:ila la necesidad de grandes
muestra eq11ivalcnte de personas a fin ele snministrar la base rnm·slt-cos :dL'atorios, rL:prcsentativos v equivalentes, de los pe-
con la cual comparar los ckctos de la variahlc experimental. ríodos. Kerr [19-15] es q11icn 111:Ís se ha aproximado ul Wí'. a
Como contraste, una forma recurrente de experimentación esle iLk:il en sns cxpcri111L'lll(lS :llTIT:l del i11Cl11jo de b mú-
con un solo grnpo uti!i'.l.a dos nrncstrns equiv,ilentes de sesio- sica sohre el rendimiento industrial. Cada uno de ellos com-
nes, con la variable experimental en una de ellas y no en la prendió 1111 solo grupo cxpcriment:il con una m11cstra alcato-
otra. EsL: disdío p11ede esquernati'.l.arse de la siguiente manera ri'.l.ada y equivalente de días a lo largo de varios meses. De
( aunque la in tL·nción es obtener una ,1lternación aleatoria, no esta forma, en un experitm:nlo pudo comparar 56 días con
regular): música y 51 días sin ella, y en otro tres tipos diferentes de
música, representada cada una por muestras equivalentes de
14 días.
Tal como lo empleó Kerr, por ejemplo, el diseño 8 parece
Este disdfo ptwde cnnsiderarse una forma del experimento de en general internamente válido. La historia, que es el principal
serie cronológica co11 la introducción reiterada de l,1 v;iriable inconveniente del experimento con series cronológicas, se con-
experi111L·11tal. [,:[ cxperinwnto es, sin duda, de mayor utilidad trola presentando X en numerosas sesiones separadas, ha-
cu,rndo se anticipa que el efecto de la variable experimc11t:1l ciendo así improbable en extremo cualquier otra explicación
scr:í de c:ir:ktcr transitorio o reversible. Al paso qne la logita fundada en la coincidencia de acontecimientos externos. Las
del c:xpe1 imento pnede considerarse una extensión del e~pe- otras fuentes de invalidación se controlan con la misma lógica
rimento de serie cronológic:1, el modo de análisis est1dístico tie- detallada a propósito del diseño 7. En cuanto a la validez
ne m,1yor similitud, en gem:r:il, con el del experimento de dos externa, es evidente que solo cabe extender la generalización
grupos en los cuales se emplea la significación de la diferencia a poblaciones probadas con frecuencia, El efecto reactivo de
entre las medias de <los conjuntos de mediciones. Por lo co- los dispositivos y la conciencia de que se es objeto de la
mún, las mediciones están apareadas de manera mny especí- experimentación constituyen una deficiencia de esta prueba.
fica con las presentaciones de .la variable experimental, siendo Cuando son grupos separados los que reciben las distintas X,
a menudo concomitante, como en los estudios de aprendizaje, puede ocurrir ( sobre todo en el diseño 6) que jgnoren por
rendimiento laboral, condicionamiento, reacción fisiológica, completo la existencia del experimento o de los tratamien-
etc. Acaso el más típico de los primeros usos de este diseño tos q11,e se comparan. No ocurre así cuando se maneja un
experimental, como en los estudios de Allport [1920] y So- solo grupo y se lo expone en repetidas sesiones a una u otra
rokin [ 1930] sobre el rendimiento escolar en condiciones di- condición, por ejemplo, a una base de cómputo de pago con-
versas, consistió en la comparación mutua de dos variables tra otra en el experimento <le Sorokin; una condición <le tra-
experimentales, es decir X1 versus X2, en vez de una sola bajo contra otra en el de Allport; un tipo de ventilación con-
de etlas cun un control. Para la mayoría de los fines resultan tra otro en los esudios de Wyatt, Fraser y Stock [ 1926],
ineficaces la simple alternación de condiciones y el empleo de y una clase de música contra otra en el de Kerr ( aunque este

86 87
investigador tomó cuidados,1s precauciones para conseguir que de presencia concreta de X. Para esos objetivos, este diseño
una programación variada se convirtiese en parte inteo-rante podría ser muy valioso. Supongamos que un maestro pone
del ambiente laboral). En cuanto a la inten1cción de scl;cción en tela de juicio el valor de las lecciones en voz alta contra el
Y_:'<, se da, corno es hahit11al, la limitación ele la generaliza- del estudio individual en silencio. Variando esos dos proce-
c1on de los efectos demostrados de X al tipo particular de la dimientos durante una serie de unidades de lecciones, se
poblaci<Ín de que se tr,lt'a. podría preparar un experimento interpretable. De ese modo
l·'.st_e dise110 cxperinll'nt:t! lkv:1 implícito un riesgo p:1ra la cabría estudiar el efecto de la presencia en el aula de un pa-
validez L'xterna que se encontrará en todos los experimentos dre que actuara como observador durante un debate volun-
descritos en este trah:1jo en los c11alcs se presentan muchos tario entre los alumnos. El conocimiento de ese tipo de di-
niveles de X para el lilÍSl/ln conjunto de personas. Ese efecto seños puede poner al alcance de un maestro individual la
se h,1 denominado «intcrfcrenci:1 <le X múltiples». ],'.] dccto de verificación experimental de las alternativas. Esto podría dar
X1, en la situacicí11 más simple, en que se la compara con lugar a procedimientos de tipo piloto que, de resultar pro-
Xo, s(ílo puelh- generalizarse a condii·iones de ptTscntaciones misorios, se examinarían por medio de experimentos de ma-
repetidas y espaci:1das de X1. No se oí rece una base sólida yor envergadura y mejor coordinados.
p_ara la gc11er:1lizaci<Ín a posihlcs situaciones en que X 1 esté Este enfoque es aplicable a un muestreo de sesiones con un
siempre presente, o a la condicilín en que se la introduzca en solo sujeto. Aunque no es habitu.al todavía administrar tests
una sol:i sesión. Ackm.ís, la co11dici<Ín Xo n la m1scncia de X de significación, es este un diseño muy utilizado en la inves-
no es típica ele ¡x:ríodos sin X en general, sino que es re- tigación fisiológica, en la cual se aplica repetidas veces un
prcscntativa solo de :mscncias de X i11tercalaclas entre presen- estímulo a u.n animal, poniendo sumo cuidado en evitar cual-
ci:1s de este factor. Si X1 tiene alo(1n h
efecto ¡Jrolonunclo
h
cJue quier periodicidad en la estimulación, ya que este último as-
1
lega a influir en los períodos sin X, como parece por lo pecto corresponde al requisito de aleatorización para aquellas
co1mín probable, el diseño experiment:1l, comp,1rado con un sesiones en que así lo demande la lógica del diseño. También
estudio con diseño 6, por ejemplo, puede subestimar el efecto pueden utilizarse cuadrados latinos en vez de la aleatorización
de X 1. Por el contrario, el hecho mismo de que se produzcan simple [p. ej., Cox, 1951; Maxwell, 1958].
frec11cntcs desplazamientos puede incrementar el valor de es-
tí11111lo de una X, exceclicnclo al que se daría en una presen-
tación continua y homogénea. En el estudio ele Kerr h,s Tests de significación para el diseño 8
melodías haw:1ianas influirían sohre el trabajo de manera has-
t;mtc diferente si se las intercalase durante todo un día entre Una vez más necesitamos pruebas de significación apropiadas
otras formas de música, que si constituyen el único «ali- para este tipo particular de diseño. Adviértase que hay im-
rnen to» musical. Los diseños experimentales de Ebbinghaus plícitas en él dos dimensiones de generalización: con respecto
r188 5] pueden considerarse en lo esencial de esta índole y, a las sesiones y con respecto a las personas. Si consideraf!l.0s
como lo ha destacado Underwood [ 1957 a], hs leves por un caso en que se utilice una sola persona, es obvio que la
él descubiertas están limitadas en sus posibilidades de gen.".- generalización de la prueba de significación se limitará a esa
ralií:ación a una población de personas que hayan aprendido persona en particular, comprendiendo una generalización en-
docenas de otras listas muy similares. Incluso gran p~ ·te de tre casos, para cuyo fin convendrá utilizar una t con un nú-
sus descubrimientos no se verifican en personas que :iprenden mero de grados de libertad igual al de sesiones menos dos.
UJ:a sola lista de sílabas despwvist:1s de significado. Así, Si se poseen registros individuales de cierto número de per-
mientras el diseño es internamente válido, su validez externa sonas sometidas al mismo tratamiento y todas ellas comparten
suele verse limitada en gran parte por ciertos tipos de con- el mismo grupo, se tendrán también datos para generalizar
tenido. [Véase también Kempthorne, ] 9 52, cap. 29. J entre personas. En esta situación habitual dos estrategias pa-
Nótese, sin embargo, que muchos aspectos de la enseñanza recen comunes. Una, errónea, es la de generar a propósito de
sobre lns cuales se desearía experimentar pueden muv bien cada individuo un puntaje único para cada tratamiento expe-
tener efectos restringidos, para los fines prácticos, al pªeríodo rimental, y aplicar luego tests de significación de la diferen-

88 89
cía entre las medias con datos correlacionados. Esta es la ló- deben aplicarse a un contenido no idéntico. El diseño puede
gica de los análisis de Allport y Sorokin, aunque en realidad expresarse así:
no se utilizaron tests de significación. Pero cuando solo están
implicadas una o <los repeticiones de cada condición experi-
mental, los errores de muestreo <le las sesiones pueden ser
muy grandes o el control de la historia muy deficiente. Los Las M indican materiales específicos, siendo la muestra Ma,
errores aleatorios en el muestreo <le sesiones podrían consti- lt,fc, etc., en términos de muestreo, igual a la muestra Mo,
tuir lo que a la luz de este análisis parecen ser diferencias Ma, etc. La importancia de la equivalencia de muestreo de
significativas entre unos y otros tratamientos. Esto será un ambos conjuntos de materiales quedaría acaso mejor indicada
error muy grave si el efecto de las sesiones es significativo si se diagramara el diseño de esta manera:
y apreciable. Sobre ese supuesw lógico se podría obtener, por
ejemplo, una diferencia sumamente significativa entre X 1 y Una persona o Muestra de materiales A (O) Xo O
X:;, cuando cada una solo haya sido presentada una vez y cuan- gmpo { Muestra de materiales B (O) X1 O
do c11 una sesitÍ11 ,ilgún acontecimiento externo haya producido
por azar un resultado nouhlc. Parece, pues, imprescindible Las O entre paréntesis indican que en algunos diseños se
que para e.ida tratamiento se «incluyan» por lo menos dos se- utilizará un pretest y en otros no.
siones y estén representados los grados de libertad entre ellas. El experimento de Jost [ 18971 sobre práctica masiva contta
La mejor forma de rnmplir con este requisito es, quizá, pro- práctica distribuida ofrece un magnífico ejemplo. En su ter-
har ante todo la diferencia e:ntre las medias de tratamiento y cer experimento se prepararon bastante al azar doce listas de
un término de error entre las diversas sesiones y con respec- doce sílabas carentes de sentido. Seis se asignaron a la
to a cada tratamiento. Después de establecer así la signi- práctica distribuida y seis a la masiva. Las doce se aprendieron
ficación del efecto del tratamiento, se podría proceder a de- simultáneamente en un lapso de siete días, combinándose con
terminar la proporción de sujetos para los cuales se verifica, cuidado su programación de modo que se controlasen la fa-
obteniendo así datos sobre la posibilid,id de generalizar el ef..:'.c- tiga y otros aspectos. Siete de aquellos conjuntos de seis lis-
to a diwrsas personas. Las mediciones y muestreos repetidos tas distribuidas y seis masivas se aprendieron durante un lapso
<le sesiones plantean muchos problemas estadísticos, algunos que se extendió desde el 6 de noviembre de 1895 hasta el 7 de
de los cuales no han sido resueltos todavía [ Collier, 1960; abril de 1896. Al final, Jost obtuvo resultados sobre 40 listas
Cnx, 1951; Kempthorne, 1952]. diferentes de sílabas aprendidas con práctica masiva y 40 con
práctica distribuida. La interpretabilidad de las diferencias
descubiertas en el único sujeto de la prueba, G. E. Müller,
depende de la equivalencia de muestreo de las listas no idén-
9. Diseño de materiales equivalentes ticas existentes. Dentro de estos márgenes, el experimento
descripto parece tener validez interna. Los descubrimientos,
El diseño 9 está íntimamente relacionado con el de muestras naturalmente, se limitan a los rasgos psicológicos de Müller
cronológicas equivalentes, y su argumento se funda en la equi- en 1895 y 1896 y al universo de material de memorización
valencia de las muestras de materiales a que se aplican las muestreado. Para poder generalizar a otras personas y esta-
variables experimentales que se comparan. Siempre, o casi blecer una ley psicológica más general, habría, por supuesto,
siempre, hay también implicadas muestras cronológicas equi- que repetir el experimento con muchos individuos.
valentes, pero pueden estar intercaladas en forma tan sutil o Otro ejemplo proviene de los primeros estudios sobre con-
intrincada, que prácticamente vienen a constituir una equi- formidad a la opinión del grupo. Moore [ 1921], por ejem-
valencia temporal. En un diseño con un grupo y X repetida, plo, obtuvo una estimación «control» de estabilidad en retest
se requieren materiales equivalentes allí donde la índole de las de las respuestas a un conjunto de ítems de un cuestionario,
variables experimentales sea tal que los efectos son perma- después de lo cual comparó esa medida con la variación resul-
nentes, y los distintos tratamientos y repeticiones de ellos tante cuando, con otro conjunto, se acompañó el retest con

90 91
una manifestación de la opinión de la mayoría. Consideremos listas, o sea, las que tenían un elevado nivel de interferencia.
en cambio un estudio en el cunl se solicita de los alumnos que La investigación contemporánea indica que la superioridad del
mnnifíesten su parecer acerca de un determinado número de aprendizaje espaciado sólo se restringe a tales poblaciones,
temas presentados en un extenso cuestionario. Se dividen en- y que en personas que aprenden por primera vez materiales
tonces las preguntas en dos grupos tan equivalentes como sea muy nuevos, no se da esc1 ventaja ( Underwood y Richardson,
posible. En un momento posterior, se devuelven los cuestio- 1958].
narios a los alumnos y el grupo vota por cada uno de los
ítems indicados. Se falsifican esos votos a fin de indicar ma-
yorías opuestas a las que prevalecieron en las dos mues- Estadísticas ele! diseño 9
tras de ítems. Como medición post-X, se solicita de los alum-
nos que vuelvan a votar sobre todos los temas. En caso de Es obvio que el muestreo de materiales guarda relación con
que el argumento de equivalencia de muestreo de ambos con- la validez y el grado de prueba del experimento. Como tal,
juntos de elementos fuera correcto, las diferencias de des- es probable que la N para el dlculo de la significación de
pLv,1mientos entre los dos tratamientos parecerían suminis- las diferencias entre las medías de grupos de tratamiento de-
trar una prueba definitiva acerca de los efectos de dar a cono- biera haber sido una N de listas en el experimento de Jost
cer Lis opiniones del grupo, aun en ausencia de grupo de con- ( o una N de elementos en el estudio de conformidad) a fin
trol alguno. de que se representara ese importante rnmpo de muestreo. Se
A semejanza del diseño 8, el 9 tiene validez interna en todos lo debe completar con una base de generalización entre per-
los puntos, y en general por los mismos motivos. Obsérvese, sonas. En la actualidad, acaso lo mejor sea hacerlo en forma
a propósito de la validez externa, que en el diseño 9, como seriada, estableciendo ante todo la generalización entre la
en todos los experimentos con mediciones repetidas, los efec- muestra de listas o ítems, computando después un puntaje
tos pueden ser bastante específicos de las personas medidas de efectos experimentales para cada persona, y empleando
en varias sesiones. En pruebas de aprendizaje, las mediciones todo ello como base para la generalización entre personas.
son parte tan integrante de la situación experimental propia (Véase la bibliografía antes citada, a propósito del diseño 8,
del método típico utilizado en la actualidad ( aunque no ne- con respecto a las precauciones que deben tomarse.)
cesariamente en el método de Jost, en el cual las prácticas
comprendieron cantidades controladas de lecturas de las lis-
tas), que esta limitación a la generalización pierde toda im-
port,rncía. Parecería que en el diseño 9 hay menos posibili- 1O. Diseño de grupo de control no equivalente
dades de dispositivos reactivos que en el 8 a causa de la hete-
rogeneidad de los mnteríales y la mayor probabilidad de que Uno de los diseños experimentales más difundidos en ]a in-
los sujetos no adviertan que reciben tratamientos diferentes en vestigación educacional comprende un grupo experimental y
momentos diferentes y para ítems diferentes. Esta escasa reac- otro de control, de los cuales ambos han recibido un pretest
tividad no aparecería en el experimento de Jost, pero sí en el y un postest, pero no poseen equivalencia preexperimental de
estudio de conformidad. Es probable, pues, que la interferen- muestreo. Por lo contrario, los grupos constituyen entidades
cia entre los niveles de la variable experimental o entre los formadas naturalmente ( como una clase, por ejemplo) tan si-
materiales sea una innegable imperfección de este experimen- milares como la disponibilidad lo permita, aunque no tanto,
to, al igual que en el diseño 8. sin embargo, que se pueda prescindir del pretest. La asigna-
Tenemos un ejemplo específico del tipo de limitación así in- ción de X a uno u otro grupo se supone aleatoria y contro-
troducido acerca de los descubrimientos de Jost. Este inves- lada por el experimentador.
tigador informó que el aprendizaje espaciado era más eficaz
que la práctica masiva. De las condiciones generales de su o X o
experimentación cabe inferir que estaba justificado al genera-
lizar sólo para las personas que estuviesen aprendiendo muchas o o

92 93
Dos cos,1s han de tenerse clarns sobre este diseño. Ante todo, columna del cu,1dro 2 y es el principal factor de validez
que IvJ .·,e ln d,hc u111f11ndir nJn el 4. el diser10 nm grupo :;:tema que c:1r:1cteri1/.a c1 ltis diseños 4 y l O.
de conuol prctc·,L-postcot, Jon(k los ~u¡dos c>-perm1,:11talcs i\.LJ.SO se aclare c,Lc punto con un ejcmplo concrcto de in-
que se toman de una población común se asignan en Jorma vestigación educaí.:ional. El estudio de Sanford y Hemphill
11lc,1toriL1 al gr11po expc:riment,il y de control. Fn scg1 mdo í 1952 l ,ohre los efectos de un rnrso de psicología en Arma-
lugar, q,1c, ,1 pl·<tr (k ello, h:1y q:.f(: admr•ir qu(· d dísc110 10 of rccc una c';,;ccl,:11tc ilustr;ici(,n del di.,cfi,1 l U. Fn ,,se
es utiliz11blc en muchas ()portunícladcs en que su11 imposibles u,,hajo, el Segundo Curso de Annapolis constituyó el grupo
lus disc:ííos 4, 5 o 6. Snbre tu,lo, habrcí que reconocer que experimental, y el Tercero, el de control. Las mayores ga-
,11111 el .1,~rcg:1d" <le un 2nq10 d,· c·r11ll H1: •10 cquir 1:1r:1dn n no i:,mcias rcgistr:ifh, p,,r el grupo cx¡1l.:ri1nn11;tl podrí:m expli-
,·quivaic·ntt'. reduce en gran parte la amiiígücdacl de Lis 111· carse corno parte de un proceso general de perfr:ccíonamiento,
tcrprctacinncs que derív:itt del diseño 2 de un 1/upo yretest- con resu l 1:xlos m,iximos en los primeros dos cursos y míni-
pnslest. Cu,mto 111:ís similares :ec:rn cu sn rcclutam1enro el mos en e! tercero v nunio, cn11,tituvf'ndo, por r:rnto, una
µ.rupu ,.~puimu:t,d y \·] de u rnrul y 111/" se u111tit1m: esa
1 inkr:1Cci,',11 entre l,Js fact,11Ts ¡Jt: ·,deccíón qne dikrencian los
símilí111d por los pnntaics del prctest, n1,1s chc1z resulta ese grupos experimental y de contru l y las ,·ariacioncs naturales
control. Suponiendo q11c estos ideales se aproximen a los m,1durnción característicacc de tales grupos, y no un efecto
¡,!,juiv1,,. ele L1 c:ilid,•;, i111n1rn, jH1,lcn1"·' ,·11nsi,krc1r q11c el .\-1 prD¡'.L1rn:1 L:xpcrirncnt:11. El grnpo p:1rticubr de control
Jíscüo controh los principales dcctos de la historia, Li ma- uiíizado por S,rnford v Hemphíll posihílita a'.guna \TrÍ·
durad/in, la administnción de tests v la in;;trumcntació 11, ficación de esta in terpret;ición rival ( en forma un tanto si-
d,,1Hlc L1 difctc:h.Í:1 p:tt a el ~\nrpn ,:xpnimcnt:il entre el pre- :'liLr ,il diseño 15, que e> pomlrc-rnos m,ís adelante). La hi-
test y el postes l ( si fuera rnayur que parn d grupo de con- u0tesis de selección-maJuración uronostical'Ía que el Tercer
trol) no puede explicarse por efectos principales de ~sas va- 'curso ( grupo de contro]i habría· de indicar en su test inicial
rinhlcs. como 1m que alcctarínn tanto :il grupo expermiental un::. supcríoridnd rc'spec10 de Lis lllé'ctÍcÍ(1nes prctest del Sc--
c(,11w ,11 de eontnil. (Sin crnlinrgo, dcbLn cxllT1,111rse la, pre gu.;d1) ( ·L:so (gwpc, cxpcrirncr1ul), C(\Jl nugníl1.:d ca,,i i¡ 11al 1

cmcío:1es sobre la historia intrnscsionJ! mencionadas en el n Li ha]Lida entte el pretest y el postest de este último gru-
diseño 4.) po. Por fortuna para la interpret,1ción de su experimento, no
Un t·sfrrcr;,u p,,r ,·xplic:r u1l:'1 1::111ancia ¡wetestpuslcsl prupía , :rrió c11 gencr:1'. nsí. L,, difcrcnci:1s enrrc los c111.StlS en t·l
del grnpo cxpc1 imental en términos de Ltctorcs externos, cumo pre'test no presemaban en la maniría de los casos ei mismo
his,oria, maduración o aplicación tests, tiene que s11pnner sentido ni igual magnitud que las ganancias pretest-postest
1111:.1 i11tLracción entre co:1s v:1ri:1bles v hs difcrcnci:1s c-;;1rcí- le1 grupo ,':<¡icrirncntaL Sin em'hargo. sus comprobaciimes de
ficas de sclccció11 que se, den enlrc ~I grupo cxpcrimen LÜ y una gan,rncia sig11:Lcativa p~ua el grupu cxpL:ríment:d en pnn-
el de control. Aunque tales interacciones son en general poco 1:1ies de confianza en el cuestionario de si tuacíones sociales
probables, hay un cierto número de situaciones en bs que m;eden e:mlícarse como Hn mecanismo artificial de selecci611-
podrí:1'1 invucarsc. Aci.;o las n::'is co1n . 1:1cs sc,111 bs i11tcr:1c ;,,:rd11r:1ei,í, El grnpu cx¡'erimcntal ¡i;t:·,Ó de ,D,26 ¡1,rntns
dones que implican maduración, Si el grupo experimental a 51,42, en tanto que el Tercer Curso comenzó por un pun- •
consta de pacientes de psicoterapia y el de control de alguna taje de 55,82 y continuó aument:rndo hnsta alcanhlr 56,78.
ull'a p,,l,Lición disponibk a la c11;1] ;;e k h:1van ;tdtni11istrnrln L,1 hipóte:,is de i11rcraccil'in entre ·w!cccic'in v m:1d11racÍ,)11 ,erá
un test y un rctcst, una ganancia pccu liar al grupo experi- en ocasiones acepurblc, aun cuando los grupos obtengan pun-
mental bien pudría interpretarse como un proceso esponLfoeo tajcs pretest idénticos, El m:ís común de tales casos será aquel
de remisión típico de grupo tan extremci, gnnanci:1 que se hu- en que nn grupo obtenga una tnsa ele m;iduraci6n n vathici6n
biese producido t11mbié11 :11111 en 1111sc11cic1 de ,\. T;i] intcr:K· aul\ÍlH)m:.1 más elc·vada CJ\ll.' el olru. El di,cño 14 ufrece una
cíón entre selección y maduración ( o selección-historia, o se- extensión del 10 gue tendería a eliminar este factor.
lección test) podría confundirse con e1 efecto de X, consti- El otro gran problema de la validez interna en el diseño lO
t1!vcndo pur LmtC> una ,nnenazrt a 1a v,t!idcz i,·ter;za dd ex· es la rcgrL>,Í.()11. C,rno se indicó o,n «?» en el cu,1drn 2, c;ibe
perimento. Esta posibilidad ha sido reprcsentadc1 ;11 la octava evitar ese riesgo, pero no siempre al tropezar con él se lo

94
sortea. En g_e,neral, si se ha e!egido cualquiera de los grupos miento de hallar pares de grupos similares. No obstante,
de comparac1on por sus punta¡es extremos de O o mediciones habría que tornar en cuenta recientes advertencias de Lord
correlativas, una díferencia en el grado de desplazamiento de [1960] a propósito del análisis de covariancia cuando la con-
pretest a postest ~ntre ambos grupos bien puede ser pro- fiabilidad de la covariable no es absoluta. También pueden
du~to de la regresión y no efecto de X. Esta posibilidad ha aplicarse puntajes simples de ganancia, pero suelen ser menos
terI_1do may~1r_ ,trascendencia a causa de una obcecada y en- conveníentes que el análisis de covariancia. La aplicación del
g:inosa trad1c1on en el ámbito de la experimentación educa- análisis de covariancia a esta situación del diseño 10 implica
c:on:d, por l~ que se considera la equiparación como una supuestos ( como el de homogeneidad de regresión) menos
tecmca apropiada y suficiente para establecer la cquivaleneia posibles aquí que en los casos del <liseño 4 [ véase Lindquist,
prccxperimcntal de grupos. Este error ha ido acompañado 1953].
p~ir la falta de distinción entre los diseños 4 y 10 y los Al interpretar estudios publicados del diseño 1O, en que se
d1fere:1tes papeles representados por 1a equiparación en los recurrió a la cquiparnción, se puede advertir que el sentido
punta¡es de pretest en ambas condiciones. En el diseño 4 del error es predecible. Consideremos un experimento de psi-
puede considerarse este procedimiento como un comple~ coterapia que utiliza como O calificaciones de descontento con
mento provechoso de la aleatorizacilÍn, pero no como un la propia personalidad. Supongamos que el grupo experimental
sustltu:o de ella; ~n términos de puntajes en el pretest O en consta de personas sometidas a terapia, en tanto que d grupo
las :7ar1ables r~kuvas, cabe organizar la población total dis- de control seleccionado está formado por personas considera-
ponible para fi_nes experimentales en pares de sujetos cnida- das «normales». En este caso el grupo de control presentará
dos~mcnte eqmparados; '.º:' intcgrant~s de esos pares se asig- puntajes extremadamente bajos con respecto al grupo normal
naran al_ azar .ª las condiciones experimentales o de control. ( seleccionados por esta característica), y regresionará en el
Esa. equ1pa~ac!ón más. la ulterior aleatorización suelen pro- postest en el sentido de la media del grupo normal, haciendo
d_L:cir un ~1seno experimental más preciso que la aleatoriza- así menos probable que se demuestre un efecto significativo
c10n por s1 sola. de la terapia en vez de producir una falsa impresión de efica-
~o debe c_on~undirse con ese ideal la técnica, correspon- cia en favor del procedimiento terapéutico.
diente al diseno 10, de tratar de compensar las diferencias El ejemplo de los pacientes de psicoterapia nos ofrece tam-
entr~ los grupos exp~ri:ncntales y de control no equivalentes bién un caso en el cual los supuestos de regresión homogénea
mediante un proccdumcnto de equiparación, cuando no se y muestreo del mismo universo, salvo para los puntajes ex-
p~et!e hacer la asignación aleatoria a tratamientos. Si en el tremos, parecen inapropiados. La inclusión de controles nor-
diseno 10 las medias de los grupos son sustancialmente di- males en la investigación psicoterapéutica, es de alguna uti1i-
ferent~s, el _r,roceso de_ egui_paración, no solo no suminis- dad, pero hay que poner suma cautela en la interpretación
tra la 1g~alac1on pretendida, s1110 que provoca la presencia de de los resultados. Es importante distinguir dos versiones del
efectos tndese_ado_s ,de regresión. Se torna previsible que am- diseño 10, y darles diferente jerarquía como aproximaciones
bos grup~s d1fer1t~n en sus puntajes postest en forma por a la experimentación propiamente dicha. Por una parte, se
completo 111depend1ente de cualesquiera efectos de X así como <la la situación en que el experimentador dispone de dos gru-
q_ue esa diferencia variará en proporción dírecta a 1~ diferen- pos naturales, por ejemplo dos clases, y puede elegir con
cia entre las P?,bla~iones totales de las que se hizo la selección, libertad cuál ha de recibir X, o por lo menos no tiene ningún
Y en proporc10n mversa a la correlación entre el test y el motivo para sospechar que se haga un reclutamiento diferen-
pre-retes t. cial con relación a X. Aunque los grupos pueden diferir en
Rulon [ 1~41 ], Stanley y Beeman [1958] y Thorndike [ 1942] sus medias iniciales de O, el estudio se aproximará a la ex-
han e~t_u:11ado este problema en forma exhn1stiva, destacando perimentación propiamente dicha. Por otra parte, hay casos
el anahs1s de covariancia y otras técnicas estadísticas sugeri- del diseño 10 en que los participantes son a todas luces
d~s por Johnson y Neyman [véase Johnson y Jackson, 1959, autoseleccionados: el grupo experimental busca deliberada-
pags. 424-44] y por Peter? y Van Voorhis [1940] para pro- mente la exposición a X, y no se cuenta con un grupo de
bar los efectos de la variable experimental sin el procedí- control tomado de esa misma población. En este último caso,

96 97
es menos probable que se cumpla el supuesto de regresión presencía del estudio del latín. Este resultado se clasificaría
uniforme entre los grupos experimental y de control, au- aquí como interacción selección-maduración. En muchos sis-
mentando en cambio la posibilidad de interacción selección- temas escolares esta hipótesis rival podría verificarse am-
maduración ( y las demás interacciones de selección). El di- pliando la gama de las O previas al aprendizaje del latín que
seño 10 «autoseleccíonadm> es, pues, mucho más endeble, se toman en consideración como en un diseño 14.
pero no ofrece información que en muchos casos eliminaría Tales estudios constituveron denodados esfuerzos por intro-
la hipótesis de que X surte algún efecto. El grupo de control ducir b mentalidad ex1;crimcntal en la investigación de cam-
ayuda a interpretar, aunque sea muy divergente en el método 'po, y merecen que se les preste renovada atención y se los
de reclutamiento y el nivel medio. amplíe con los métodos modernos.
La amenaza que la administración de tests constituye para la
validez externa es la expuesta a propósito del diseño 4 ( véa-
se pág. 32). El signo de interrogación para la intc1:,lcci611 de
la selección y X nos recuerda que el efecto de X bien puede 1 J. Diseños compensados
ser específico de los participantes seleccionados como lo fue
de los participantes de nuestro experimento. Con~o _los re-
quisitos del diseño 10 pueden poner menos restt1cc1ones a Bajo este título se reúnen todos aquellos disefíos en los cua-
nuestra libertad de muestreo que los del diseño 4, esa espe- les se logra d control experimental o se aumenla la precisión
aplicando a todos los participantes ( o situaciones) la totalidad
cificidad será por lo común menor que en un experimento
de laboratorio. La amenaza a la validez externa proveniente de los tratamientos. Esos díscfíos recibieron las denominacio-
de la reactividad Je los dispositivos existe, pero tal vez nes de «experimentos rotativos>► [ según McCall, 19 23 J, -«di-
en menor grndo que en la mayoría de los experimentos pro- scfíos compensados» [p. ej., Underwond, l949], «llisefíos
piamente dichos, como el diseño 4. . cru:;:ados» [Cochran y Cox, 19"i7; Cox, ] 9.58] y «diseños
Donde existe la posibilidad de udliwr dos cursos mtacto.;; de rnnmuh,~ión» [KeÍnpthnrne, 1952]. F.] dispositivo de cua-
con el diseño 10, o la de tomar muestras aleatorias de los .:Jrado latino es el que más se uti!i?:a en .la compcusación.
alumnos fuera de las aulas para distintos tratamientos expe-• h;c cuadrado latino es el utilizado en el cliseíío 11, esquema-
rímentales según un diseño 4, 5 o 6, es casi seguro que tb:ado aquí como cuasiexperimental, en el que se aplican
este último dispo~itivo scn1 más reactivo, creando mayor con- cuatro u:at1m1icntos experimentales en forma restrictivamente
afratori:ul(la y por turno a cuatro grupos formado:-; de ma-
ciencia de que se está siendo sometido a experimento -la
sensación de «ser un conejillo de Indias>> y similares. nera naturnl o incluso a cuatro individuos [p. ej., JVfoxwdi,
Los estudios de Thorndike sobre disciplina formal y transfe-- l 9581:
rencia [p. ej., E. L. Thorndike y \X'oodworth, 1901; Brolyer, Primera Segunda Tercera Cuarta
Thorndike y Woodyard, 1927] constituyen otras tantas aplí- vez vez vez ve.z:
cndones del diseño 10 a X no controladas por el experimen-
tador. Tales estudios soslayaron, al menos en parte, el error Grupo A X10 X.O X::O X10
_,_ •=-- .__.....,., r-~ >•~•-• -- --- - • ,-....~• -- -,,

de los efectos de regresión causados por la equípar::ici6n sim- Grupo B x~o


--~ ---·- X10
•--·~··· ...
X,O x,o
·-·-~ ~- -- -- -·--- - -
ple, pero habría que compararlos cuidadosamente con k~s ?-1é- •--""" ,- ~,~-

todos modernos. Así, es prob,161e que el uso de estad1st1cas Cn1po e X:10 X10 X10 x~o
-- -- -- -·-, - --
de covariancia produjera una prneba más contundente, por (;rnpo D x~ o X::O x~o
ejemplo, de trasferencia del vocabulario latino al inglés.
En otro sentido, los efectos por lo común positivos, annqne El disciio ha sido diagramado sólo con postests, d,,do que
mínimos, que se hallaron podrían explicarse no como trnsfe- presta particular utilid,id allí donde los pretcsts resultan
rencias sino como la selección en los cursos de latín de los inapropiados y no se dispone de diseños como el 10. El
alumnos cuyo índice anual de enriquecimiento de vocabulario disefío contiene tr.:s clasificaciones ( grupos, sesiones y X
habría sido mayor que el del grupo de control, aun sin la o trMamíentos experimentales). Cada clasificación es «orto-

98 99
gana!» respecto de las otras dos, en el sentido de que cada maduración, los efectos de la práctica, etc. Si se tuviese que
variable de cada clasificación se produce con la misma fre- organizar así un experimento con control tata~, cada p~rso-
cuencia ( una vez para un cuadrado latino) con cada variable na debería ser asignada a cada grupo en forma mdepend1e1;,te
de cada una de las otras clasificaciones. Obsérvese que rnda v aleatoria, eliminándose esta fuente tanto de los efectos prm-
tratamiento ( o X) ,sólo se da una vez en cada columna y cac!a ~ipalcs como ele la interacción, al menos en lo que concierne
fila. El mismo cuadrado latino puede modificarse de tal ma- al error de muestreo. Es característico del cuasiexperimento
nera que las X se conviertan en títulos de filas o de columnas: que la compensación se introduzca p~ra s1~1:1inistrar ~na suer-
te de igualación, solo porgue tal as1gnac10n aleatoria no es
X1 x~ X:: X1 posible. ( Como contraste, en diseños del todo controlados, se
Grupo A t10 tiO t.10 t10 emplea el cuadrado latino por razones de economía o para re-
Grupo B t:;0 t10 tiO t20 solver problemas peculiares del muestreo de parcelas.) Una
Grupo e t~O ti O [¡() t30 segunda posible fuente de efeelos entremezclados en l~s gru-
Grupo D tiC) t:iO t~O tiO pos e, la vinculada con secuencias específicas de tr~tam1ento~.
Si todas las repeticiones de un experimento propiamente di-
Resultan así comparables las sumas de puntajes por X, al te- cho hubiesen seguido el mismo cuadrado latino, esta fuente
ner representados, en cada una de ellas, cada oportunidad y de efectos principales y de interacción también habría es~a-
grupo. Las diferencias en tales sumas no se podrían interpre- do presente. Sin embargo, en el típico experimento propia-
tar como resultados artificiales de las discrepancias grupales mente dicho, a algunos grupos de participantes se les_ ha-
iniciales o de efectos de la práctica, la historia, etc. De pare- brían asignado en la repetición diferentes cuadrados latinos,
cida comparabilidad son las sumas de las filas para diferen- climinfodose así el efecto sistemático de secuencias especí-
cias grupales intrínsecas, y las sumas de las columnas de la ficas. De ese modo se elimina también la posibilidad de gue
primera presentación para las diferencias en las sesiones. Des- determinada interacción sistemática haya producido un apa-
de el punto de vista del análisis de variancia, el diseño parece rente efecto principal de las X. . .
suministrar así información acerca de tres efectos principales Es probahle que las sesiones produzcan un efecto pr'.nc1pal
con el número de casilleros que suelen exigirse para dos. Re- debido a la repetida aplicación de pruebas, la ~adura~1~n, la
sulta evidente el costo de esta mayor eficacia: lo que parece pníctica y los efectos acumulados o trasferencias. As1m_1smo,
ser un efecto principal significativo según cualquiera de los la historia puede generar efectos con respecto a las ses10nes.
tres criterios de clasificación, acaso constituye en cambio una El dispositivo en cuadrado latino impide, por supuesto, que
compleja interacción significativa entre los otros dos [Lind- esos efectos principales contaminen los de ~- Per? d??de_ ta-
quist, 1953, págs. 258-64]. Las diferencias aparentes entre les efectos son síntomas de una heterogeneidad s1gmf1cat1va,
los efectos de las X podrían resultar un complejo efecto es- es probable que se justifique más la sospe~ha_ de interacciones
pecífico de interacción entre las diferencias grupales y las significativas que cuando tales efectos pnnc1pales no se pro-
sesiones. Las inferencias sobre los efectos de X dependerán ducen. Los efectos de la práctica, por ejemplo, quizá sean
de la admisibilidad de esta hipótesis rival, y por lo tanto las monótonos, pero también es probable que no sean lineales" y
estudiaremos en forma más detallada. generen efectos tanto principales _como de inte~acción. Muc~as
Digamos, en primer lugar, que la hipótesis de tal interacción aplicnciones de los cuadrados latinos en expenmentos propia-
es más admisible para la aplicación cuasiexperiment8l descrita, mente dichos, como en la agricultura, por ejemplo, no exigen
que para las de los cuadrados latinos en los experimentos reiteradas mediciones y es característico que no produzcan
propiamente dichos mencionados en los textos. En lo que ningún efecto sistemático correspondiente de colu?1na._ Los del
•se ha denominado la dimensión grupal, se entremezclan dos tipo cruzado, sin embargo, comparten este posible mconve-
posibles fuentes de efectos sistemáticos. Ante todo, están los niente con los cuasiexperimentos.
factores de selección sistemática implicados en la formación Estas consideraciones permiten apreciar la máxima importan-
natural de los grupos. Cabe esperar que esos factores tengan cia de la repetición del diseño cuasiexperimental con diferen-
a la vez efectos principales e interactúen con la historia, la tes cuadrados latinos específicos. Tales repeticiones, realizadas

100 101
en número suficiente, harían del cuasiexperimento un experi- uno solo de los grupos a un acontecimiento externo (historia)
mento propiamente dicho. Es probable que implicasen tam- o a la práctica (maduración) podría simular un efecto de X,
bién cantidades suficientes de grupos para posibilitar la asig- en el diseño compensado tales efectos coinciden tes tendrían
nación aleatoria de grupos intactos a los tratamientos, medio que darse en sucesivas sesiones separadas y en cada uno de
de control que por lo común es preferible. No obstante, ca- los grupos. Este resultado supone, por supuesto, que no inter"
reciendo de tales posibilidades, un cuadrado latino único cons" pretaríamos un efecto principal de X como significativo si la
tituyt: un diseño cn:1siexpcrimental intuitivamente satisfacto- inspección de los casilleros indicase que un efecto principal
rio, a causa de su dcmostrnci(m de todos los efectos en la desde el punto de vista estadístico ha sido originado, funda-
totalidad de los grupos de comparación. Í\1111 reconociendo mentalmente, por un muy poderoso efecto en solo uno de los
los posibles errores de interprct,1ción, constituye un discf'ío grupos. Para un estudio más detenido de esta cuestión, véanse
qul' bien vale la pena adoptar cuando no hay ¡,osibilida- WilkyKempthorne [1957],Lubin [1961] yStanley,[1955].
clcs de un control 1rnís eficaz. lJna vez desLK:uh,s sus graves
inc1111vcnicntl's, cx:1rnincrnos sus ventajas relativas.
Como todos los cuasiexperimcntos, gana este en pujanza con
la congruencia de las repeticiones intern:1s de la prucba. Para 12. Diseño de muestra separada pretest-postest
poner de relieve esa c011gruencia, deben eliminarse los efectos
principales de las sesiones y los grupos, expresando cacla Para grandes poblaciones -p. ej., ciudades, fábricas, escue-
casillero como un desvío respecto de las mcdi,1s de filas (gfll- las y unidades militares-, suele ocurrir que, aunque no se
po) y columnas (momentos): M!l1-M,,.-M.1+M ... Des- pueden segregar subgrupos en forma aleatoria para tratamien"
pués se reordenan los datos, con los tratamientos (X) enea" tos experimentales diferenciales, cabe ejercer algo así como
bezando las columnas. Supongamos que el cuadro que ohte" un control experimental completo sobre el momento de apli"
nernos es de una satisfactoria congruencia, que el más eficaz Je eación y los destinatarios de la O, utilizando procedimientos
los tratamientos es el mismo en los cuatro grupos, cte. ¿Cuáles de asignación aleatoria. Ese control posibilita el diseño 12:
son las probabilidades de que eso no sea un efecto re,1l de los
tratamitntos, ,ino una interacción de grupos y sesiones? Po- RO (X)
demos observar que casi todas las posibles interacciones de R X O
grupos y sesiones reducirLm o enturbiarían el efecto mao1i-
ficsto de X. Una interacción que imitara un efecto principal En este esquema, las filas constituyen subgrupos de equiva-
de X sería poco probable, y lo sería menos aún en cuadrados lencia aleatoria, representando la X entre paréntesis una pre-
latinos mavores. sentación de X sin importancia. Se mide una muestra an-
Nos sentirimnos muy atraídos por este diseño cuando tuvi¿- tes de X, otra equivalente después de X. El diseño no es in-
semos control de programación sobre unos cuantos grupos de trínsecamente eficaz, como lo indica su fila en el cuadro 2.
formación natural, como por ejemplo clasts, pero no nos fue- No obstante, suele resultar viable, y a menudo merece que
se posible subdividir esos grupos naturales en subgrupos de se lo aplique. Se lo ha utilizado en experimentos de ciencias
equivalencia aleatoria, sea para una presentación <le X o para sociales que son aún los mejores estudios existentes en sus
aplicar tests. En tal situación, si hubiera cómo aplicar un temas específicos [p. ej., Star y Hughes, 1950J. Aunque se
pretest, se dispondría asimismo del diseño 10: también im" lo ha denominado «diseño simulado antes-y-después» [ Selltiz,
plica una posible confusión de los efectos de X con interac- Jahoda, Deutsch y Cook, 1959, pág. 116], vale la pena des-
ciones de selección y sesiones. Se juzga que esta posibilidad tacar su superioridad respecto del diseño común antes-y-des"
es menos probable en el diseño compensado, porque en caJa pués, el diseño 2, por su control tanto del efecto principal de
grupo se demuestran todas las comparaciones y por lo tanto la aplicación de tests como de la interacción de la adminis"
se necesitarían varías interacciones equiparadas a fin de imL tración de tests con X. El defecto fundamental del diseño es
tar el efecto experimental. que no puede controlar la historia. Así, en el estudio de la
Mientras que en los otros diseños la especial sensibilidad de campaña de publicidad realizado en Cincinnati para las Na-

102 103
ciones Unidas y la UNESCO [Star y Hughes, 1950], es pro- do se la utiliza en el marco de las encuestas por muestreo. Si
bable que hechos externos de la escena internacional lrnbie- en el prctest y el postest se recurre a los mismos encuestadores,
ran sido la causa de la reducción observada en el optimismo suele ocnrrir que muchos, carentes aún de experiencia en el
sobre la coexistencia pacífica con Rusia. pretest, la hayan adquirido en el postest o tengan en él mayor
Est,1 obra aspira a estimular los dísefios <<de retazos», en los soltura. Si en cada tanda de encuestas se recurre a dístíntas
cuales se agregan aspectos que permitan controlar factores personas para esa tarea, y su ní1rncro no es elevado, las dife-
específicos, de ordinario uno por vez ( en contraste con los rencias en la idiosincrasia de los encuestndorcs se confun-
experimentos propiamente dichos, <fo mayor elegancia, en que den con la variable experimenta!. Si los experimentadorc::s
con un solo grupo se controlan todas las amenazas a la validez conocen la hipótesis, sus expectativas pueden provocar dife-
interna). Repitiendo el disefio 12 en diferentes situaciones y rencias, háyase o no t rnsmi tido la X, como lo demostraron
momentos, como en el diseño 12a ( véase cuadro 2, ¡xíg. 80), con sus experimentos Stanton y Haker [1942 J y Smith y Hy-
se controla la historia, pues si el mismo efecto se da en varías man [1950]. En un caso ideal se utilizarían muestras aleato-
ocasiones, la posibilidad de qne sea tesult:1do de acontecimien-- rias equivalentes de distintos entrevistadores en cada tanda,
tos hist6ricos coincidentes se torna menos probable. No obs- manteniéndolos ignorantes acerca del objeto del experimento.
bank, las tendencias históricas persistentes o los ciclos esta- Además, el reclutamiento de los encuestadores puede indicar
cionales siguen constituyendo explicaciones rivales no contro- diferencias estacionales, por ejemplo, ya que durante los me-
ladas. Por la repetición del efecto en otras condiciones, cabe ses de verano se dispone de más estudiantes universitarios,
reducir la posibilidad de que el efecto observado sea caractc-- etc. Las tasas de rechazo son acaso menores y la duración de
J'Ístico de la única población seleccionada en el primer mo- las entrevistas mayor en verano que en invierno. Para cues-
mento. No obstante, si la situación <le la investigación permite tionarios autoadministrados en el aula, este error instrumental
utilizar el diseño 12a, también será vinble el 13, que en gcne- será menos probable, aunque las orientaciones hacia la admi-
rnl i-esultará preferible. nistración de tests quizá se desplacen en formas mejor clasifi-
Es poco probable que se invoque la maduración, o el efec- cables como instrumentación que como influjos de X sobre O.
to del envejecimiento de los participantes, como explicación Pata prctcsts y postcsts aplicados con varios meses de separa-
rival, ni aun en estudios sobre la opinión pública que se ex- ción, la mortalidad puede plantear un problema en el diseño
tiendan durante meses. Pero en la encuesta por muestreo, y 12. Si ambas muestras se eligen en forma simultánea ( punto
hasta en ciertos cursos universitarios, las muestras son sufi- R) , es de su poner que a medida que trascurra el tiempo más
cientemente grandes y las edades lo bastante heterogéneas pa- integrantes de la muestra elegida se tornen inaccesibles, per-
ra que se puedan comparar las submuestras del grupo pretest diéndose los segmentos más transitorios de la población, lo
que difieren en maduración ( edad, número de semestres cur- cual producirá una diferencia poblacional entre los distintos
sados, etc.). La maduración, y la acaso más peligrosa posibili- períodos de entrevista. Una advertencia de esa posibilidad la
dad de tendencias persistentes y estacionales, también es con- constituyen las diferencias entre los grupos en el número de
trolable por un diseño como el 12b, que agrega un grupo pre- personas no entrevistadas.
test anterior, aproximando el diseño al de series cronológicas, En estudios realizados a lo largo de períodos extensos, las
aunque sin la aplicación reiterada de tests. Para poblaciones muestras para pretest y postest deberían seleccionarse acaso
como la de pacientes a quienes se aplican tratamientos de psi- en forma independiente y en momentos distintos apropiados,
coterapia, donde podría darse una mejoría espontánea o cu- aunque ello también posee una fuente de sesgo sistemático,
ración, los supuestos de linealidad implicados en forma im- resultante de los posibles cambios en el esquema residencial
plícita en este control quizá no fueran aceptables. Es más pro- del conjunto del universo. En algunos medios (p. ej., en las
bable que la tendencia de maduración reciba una aceleración escuelas, los archivos permitirán que se eliminen los puntajes
negativa, haciendo así que la ganancia de maduración 0 1 - o~ pretest de quienes no estarán ya disponibles en el momento
sea mayor que la de 02 - O:i, en detrimento, por tanto, de la del postest, haciendo así más comparables el postest con el
interpretación de que X ha producido efecto. pretest. Para lograr un mecanismo que haga posible esa correc-
La instrumentación constituye un riesgo en este diseño, cuan- ción en la encuesta con muestras, así corno una ratificación

104 105
del efecto que no pudiera contarmnarse con la mortalidad se 13, Diseño de muestra separada pretest-postest
puede someter el grupo pretest a un nuevo test, como e~ el ,on grupo de control
diseño 12c, donde la diferencia 01 0 2 confirmaría la com-
p~ración 01 Oa. Así, el estudio que Duncan y otros [1957] Se supone que el diseño 12 ha de utilizarse en aquellas situa-
etectuaron sobre la reducción en las creencias erróneas lograda ciones en que la X, si existe, debe presentarse al grupo como
durante un rn.rso introductorio de psicología. ( En este di- un todo. Si se cuenta con grupos cornparablcs (ya que no
setío, el grnpo so.metido a un retest no permite que se exa- equiv,1lcntcs) a los cuales sea posible rehusar la X, se podrá
mmen las g,111a11crns de personas con puntajes inicíaks diver- agregar un grupo de control al diseño 12, creando así el
s~is, por no haberse utilizado un grupo de control para veri- dísefio U:
ficar la existencia de regresión.)
Lo rnrncrerístico de este diseño es que lleva el laboratorio ,l la RO (X)
situ,ación de campo a la cual el investigador desea extender
sus gencrnlízaciones, probando los efectos de X en su ambien- R X O
te na.tui:_al. En ge!1eral, según se indica en los cuadros 1 y 2,
los. d1senos 12, 12a, 12b y 12c pueden resultar superiores en RO
valide;,; c:-cterna o pos_ibili<lad l!e generalización respecto de R o
l~)s cxpe_m~entos prop1~mente dichos de los diseños 4, 5 y 6.
hstos dtscnos no requieren gran cooperación de los partici- Este diserto es bastante parecido al 10, solo que no se vuelve
pnntes, ni que estén disponibles en ciertos lugares y momentos, a someter a test a las mismas personas y, por lo tanto, se
e_rc., de modo .que se puede utilizar un muestreo representa- evita la posible interacción entre la administración de tests
tivo de poblaciones previamente determinadas. y X. Como en el diseño 10, la desventaja del 13 en cuanto a
En }os diseños 12 y lj ( y sin lugar a dudas también en algunas la validez interna proviene de la posibilidad de interpretar co-
varnmtes de los d1senos 4 y 6, donde X y O se trasmiten por mo efecto de X otra tendencia local propia del grupo experi-
contactos individuales, etc.), es posible el muestreo represen- mental que, en realidad, no ha influido. Aumentando el nú-
tativo. Los signos positivos en la columna de interacción se- mero de las unidades sociales implicadas ( escuelas, ciudades,
lecci~n-X son muy relativos y con todo derecho se los podría fábricas, buques, etc.) y asignándolas en cierto número y con
cambiar por. signos de interro~ación ya que en la práctica ge- alcatorización a los tratamientos experimentales y de con-
neral las unidades no se sclecc10nan por su relevancia teórica trol, 0e conseguirá eliminar la única fuente de invalidación,
sin<! a menudo por razones de cooperación y accesibilidad, qu~ lognfodose así un experimento propiamente dicho, análogo al
posiblemente las tornen atípicas del universo al cual se las disefio 4, con la única diferencia de que se evitan nuevss
desea generalizar. pruebas sobre los mismos individuos. Este diseño puede de-
Star yHughes [1950] no deseaban generalizar a Cincinnati signarse 13a. Su esquematización ( en el cuadro 3) se ha visto
sino más bien a los ciudadanos de Estados Unidos o al mun~ complicada por los dos niveles de equivalencia ( logrados por
do en general, y persiste la posibilidad de que la reacción a asignación aleatoria) en él implicados. En el nivel de partici-
X en aquella urbe fuese atípica de esos universos. Pero el pantes, existe en el interior de cada unidad social la equiva•
grado de ese sesgo de accesibilidad es tan inferior al de otros lencia de las muestras separadas pretest y postest, indicadas
diseños más exigentes que, en comparación, parece justificado por el punto R de asig::iacíón. Enrre las varias unidades socia-
atribuirle un carácter positivo. les que reciben cualquiera de los tratamientos, no se verifica
esa equivalencia, lo cual se indica con la línea punteada.
La R' designa la igualación del grupo experimental y el de
control por la asignación aleatoria de esas muchas unidades
sociales a uno u otro tratamiento.
Como puede verse en la fila correspondiente a 13a del cua-
dro 3, este diseño obtiene un puntaje perfecto para validez

106 107
tantu interna como externa, esta última en virtud de los Cuadro 3. Fuentes de inv,didación para los diseños 13 a 16.
furn ,H:111(), \'.l ,_,x¡ :T,tos :1 : 1'\JIHX,'
1 del ,l' 'i!O 12, v con
1

rn,1F•r hincapi,: en el problt:1 u de fo mtcraccíón selección-X,


,1 ca11sc1 de quc están rqncsenudas mt:drns unidades snciales y
110 u1:1 snla. Q11c ncst>tros sc-¡1:m1cis, c;;tc cf,c11(), cxcclcnre
1.wru ,;,st1,s11, :hJ li:1 ,,id,, 111ili1,1do 11u1,c,1.

14. Diseño de senes cronofógica~ múltiples

,l :11 i,, c·c;l1Hli, ·, ,L, ¡,,r;·,1 c:1•1 ;JI<,:: :1cl1ni11i:,tr:n·'-''" p, medio


lJ1 ;, /IUS rfl{/s•;r,
de &nos en scri,:s croi;;Ji<Ígicas. :d invcsci,!ador le conviene bus- m,·nt,;frs ( cn11!.
car u ,a instítmi6n si:nilar 11,l a···x, de la cual tomar ]3. 1)is<·fío d,_, 1 e
cL· ✓,_e-ni::
1nttf•Sh;1 \<'' :1rnda
tr11a ·¡e• Cl\!JJ 1 ( i,ll·:d1nc11l"l', c1_)n
fll('l•·:,t ·j)i>'·,I• •,l
X :ida ;1 ! ,,;:ar). r_,·,n 1:;r11p1)
contr()I
JI o ,X1
() () o oxo () () o Jl .,V o
n ()
H o
(J.O O O O O CJ O 13a Jl o tX + 1- e
J ¡¡
/í () '
o
F.<,1C ,¡¡ ;c.·1í1l c,,nt i,·:w ( ,·11 Lh () l¡t'c· c,,,npr,:11ck11 :1 X) el JJÚ·
l \ )

l In
r /l' H X o
mero 10, de grupo de contnd no equivalente, peru gana ( .\).
l ;; o X o
ccrtid,1;nbrc de intcrpretcición P"r las rnúltiples rncdicio11,·s re-
¡ircs1_ 1.1d:1s, Vi. q11t: ,·11, :CTIU 1;,·::tído el, f'cct,l ,._,,pcrim,_·11::il se
demuestra dm veces, rcspcclo del control y respecto de los ;' . ()
f no
()

valore., pre-X cn su propia serie, como en el diseño 7. o


H' ¡¡ ()
más. 1:1 inteL1c:ción cn1rc sclcc/ín v n;:Hlur:1,·;ó:1 ,1_• t·, :r,il,1 n ()
,. ·n el ·'\ni.ido cL que, .,i el gru¡J() e~~erimental d_cmo::tr,í por
14. S{'ríe,'> crnn,i!/)gícns
lo conmn una mayor usa de ganancia, :1pareccrla as! las w~llltiplc;.;
O pre-X. En l,Js cuadros 2 y 3 es esca,:1 la de O O OXO O O
() () (_) ( l () ()
,>:ta •:eva ga11c11H:ia, p,10 ,1parc,c en i:1 ,·cl111nr,.1 li1ul ,l, va
lidez interna, titulada «Interacción de selccci611 y m:idura- 15. Di~wño d(• ciclo
.instltt1cion;tl
,_ión». Puesto C!Ue la maduración se controla tanto en la serie Cl. A X 0 1
l'X}li'l'Ín~c:nt:il ci1mo en Li d,., C\\litrnl, ¡1,1¡ h,, ll!CS ll]l'.';
tct:s en nuestrn primera present:tción del Jise,ío 7 de ~erie
,:ronol6gíca, la díferenci:1 en b ,elección de los grupos, q,ze
opern j1rntnmcnte con la mad11r:1ci6n, in,,trnm,·11Uci6n o ,e:
¡:rcston, dif'íciln:v11tc podr.í exp·;e;ir un efecto n\ltori¡, Sin
embargo, no se excluye la posibilidad cL una interacción en- ·I ? +
tre la diferencia de selección h histori'.1. ?
CnnH1 •<'11 el dí-;efío 7 de no11<ll, ,e :::1 puc-10 un
negativo en la columna de valide/ externa para ]·, 111· +
16. l>íscontinuidad + + ? +
,,n L, 1T! '1"\ÍÓn

108
teracción entre la aplicación de pruebas y X, aunque como en La idea fundamental puede apreciarse en las filas segullda y
el caso del mismo disefio 7, el que comen tamos se empleará tercera del cuadro 1, donde se advierte que los signos po'.'Í-
a menudo cuando la administración de los tests no sea reac- tivos y negativos de los·, disefios 2 y .3 s~Jn en su mayor part_i.:
tiva. También la habitual preocupación acerca de la posible complementarios, y que, en consecuencia, la correcta comb1-
especificidad de un efecto demostrado de X en la población que nación de esos dos criterios, insuficientes por sí solos, po-
se estudia queda registrada en el cuadro 3. En cuanto a los tests dría tener gran vigor. El diseño es apropiado para aquellas
de significación, se sugiere qu::: la,; difercncÍfls entre la serie situaciones en que se presenta en forma cíclica, a cada_ nu~vo
experimental v la de control se nna.liccn como los datos del grnpo de participantes, cierto aspec_to d~ un proceso .m~utu-
discfio 7. Par;xe mucho más probable la linealidad de estas cional ( escuelas, métodos ele adocttmam1ento, aprend1za1e de
diferencias que la de los datos no elaborados de las series oficios, etc.). Sí en esas situaciones nos interesa la evaluación
ctonológicas. de los efectos de una X tan global y compleja corno un pro-
Este es, en términos generales, un excelente diseño cnasiexnc- grama de adoctrinamiento, es probable que el l~Ísefio d~ ciclo
rimcntal, ,icaso el mejor de los m,ís viables. Presenta cla;·as institucional recurrente ofrc,:ca la respuesta mas aprox:1mada
vellt:ij:is respecto de los disdíos 7 y 10, como ya lo hemos posible resultante de .los disefios que rrnsta ,1qui hemos ex-
indicado al presentar el disci1n .1 O. La posibilidad de cfcctnar puesto. . . .,
reiteradas mediciones torna pm·1ícuhrmcnte apropiadas las El díscfío se ideó otiginnriamente durante una mvcst1gac1on
sc1·ies CJ"onohígirns 1111'.iltiplcs para las i nvcstigaciuncs que se de los efectos de 1111 afio de cnttcn:nnicnto para oficiales y
llevan a rnbo en cstahlecimicnlos educativo~. pilotos sobre las actitudes hacia los superiores y los subordi-
nados y las funciones de lidcrn'.r'.go de un gmpo de cadetes de
la Fuerza Aérea, mientras se completaba un ciclo de entrena-
miento de 14 meses [ Campbdl y McCormack, 1957]. La res-
1 5. DisCill) de ciclo 111stit ucio11al recurrente: tricción que impidió qne se rcalizata un experimento propia-
1m disci'to «rle n'tazos» mente dicho fue la imposibilicbd de controlar quiénes esta-
rían expuestos ,1 la variable experimental. No había J:otma de
dividir el curso de ingreso en dos mitades ignalacbs, una de
El diseí'ío 1'5 ilust r-aHn,1 cst r<1tegia r,m1 la investigación de
las cuales cu.rsaría el programa anual pfonificido, mientras que
campo en la c1wl ,:e comÍl·111/·t por un cli~eño insnfícicnte v se a la otra se la haría volver a la vida civil. Aun en el supuesto
v:in s11m,1ndo luego car,1ctcrbticas particul:ues, a fin de ii{vcs- de que fuese posible un experimento propiamente dicho de esa
tigar una u otra cll: las fuentes rccurre11tf>; de invalidaci6n. El índole ( y el aprovechamiento opottunc de imprevistas reduc-
rcstiltndn L:s a menudo 111!a burda acumulación de vcrifirncio- ciones presupuestarias pudo hi,hcrlo hecho posible en más de
nes prccau totias, que carece de la sirndrfa intrínseca de los una ocasión), los efecto, reactivos de ese dispositivo experi-
discfíos t'xperimcntales propiamente di::hos, pcrn se asemeja mc11 tal -el inevitable trastorno en las vidas de quienes fue-
a la experimentación. Como parte de esa eslrntcgia, el cxpc:- sen aceptados, seleccionados, trasportf!dos a b base aérea y
rimcntador habrá de estar alerta ante las intcrprct,Kio11cs ,m- devueltos después a sus casas- distatfa mucho de hacer de
tagónícas ( ajenas al efecto de )C1 que d disefío ofren:, y ellos nn grupo ideal de control. La diferencia entre ellos y el
tendrá que buscar la explicación ,fo lo:-; d,itns, o las posibles grupo experimental que recibiría el ado~trinamicnto difícil-
extensiones de ellos, que penpitírfon dcscartaelns Otro aspec- mente podría constituir una base adecuada sobre la cual ge-
to bastante característico de estos disefíos es q11e el cfect" de neralizar las conclusiones obtenidas a las condiciones norma-
X se demuestra en varias formns diferente~. Este ,,spccto es les de reclutamiento v entrenamiento de las milicias. Queda-
importante sin duda cuando cada compmación especifica sea ba, sin embargo, el c~ntrol del experimentador sobre I~ J?tO-
equívoca por sí sola.
o-ramación del momento v los destinatarios de los proced1m1en-
El diseño «de retazos» específico que exponemos se limita ~os de observación. Esto-, más el hecho de que la variable ex-
a un riguroso conjunto de cuestiones y situaciones, y explota perimental era recurrente y se presentaba constantemente a
según las circunstancias las características que estas exhiben. cada nuevo grupo de participantes, hizo posible cierta form:1

110 11 J
de control experimental. En aquel estudio se disponía de dos completado su exposición a X y l~~go elimina de 02 ,todas
clases de comparaciones relativas al influjo de la experiencia las medidas pertenecientes a paruc1pantes qu~ despues no
militar sobre las actitudes. Cada una de ellas era bastante completaron su instrucción. La frecuente ausen_oa de est~ pro-
insuficiente desde el punto de vista del control experimental, cedimiento justifica la inserción de un signo 111terrogauv_':, al
pero cuandu ,1mbas suministraron pruebas coincidentes, se lado de la variable de mortalidad. La columna «Regres10n»
ratificaron entre si en la medida en que ambas incluían :ms se completa con signos interrogativos .ª fin de señ~l~r la po-
respectivos puntos débiles. La primera ofrecía comparaciones sibilidad de efectos espurios si la medida que se utiliza en el
entre poblaciones medidas al mismo tiempo pero con distinta diseño experimental es la misma en que se fundan la a~epta-
duración de servicio. La segunda incluía mediciones del mis- ción o el rechazo de candidatos al curso de entrenamiento.
mo grupo de personas en sn primera semana de entrcnmnien- En tales circunstancias serían de prever diferencias constan-
to milit,ir y otra vez después, trascurridos ya unos 13 meses tes no atribuibles a los efectos de X. La comparación pretest-
de servicio. lJn tanto estilizado, el discíio e~ como sigue: p~stest implicada en O:! y 0:,, si resulta ser e~ n;ísmo tipo d,e
diferencia que en la comparación O:! - 01, ehrnma las demas
Clase A X 01 hipótesis posibles de que _la diferencia se deba a' un ,desvío
en la selección o reclutamiento entre ambas clases, as1 como
Clase B cualquier posibilidad de que la mortalidad haya sido la cat:s,a-
No obstante, si: no se utilizara más que la compara~1on
Este diseño combina los enfoques «longicudinab y de «corte 0 2 O::, sería vulnerable a las explicaciones rivales de histo-
trasversal» que suelen empicarse en la invcstigaci6n del desarro- ria y aplicación de tests. .
llu. En esta se supone que la comparación es tal, que pueden En un·1 situación donde el lapso de entrenamiento que se exa-
medirse a la vez un grupo expuesto a X y otro que va a serlo; mina ~s de un año, el aspecto más costoso del diseño es la
esta comparación entre 01 y O:! corresponde así al diseño 3, progrnmación de ambos coni~?tos de m_ediciones con un !ño
«Comparación de grupos estáticos». La segunda mcdici6n del de diferencia. Dada la invers10n ya realizada en este sentido,
personal de la Cbse B, un ciclo después, nos da el segmento constituye Ll11 pequeño gasto más rea 1izar nuevas pruebas en
de diseño 2, «Pretest-postest de un grupo». En el cuadro, la segunda oca3ÍÓn. Teniendo en cuenta todo ello, _ca~e exten-
p,íg. 109, las dos primerns filas referentes al diseño 15 mues- der el diseño institucional recurrente al esquema md1cado en
trnn un an:ílisis de esas comparaciones. La comparación cru- ei cuadro 3. Ejerciendo el poder de designar cuándo y a quién
zada de O 1 o~ sum i11 ístra diferencias que no podrían expli- se Ji,1 de medir la Clase B se ha dividido en dos muestras
carse por los efectos de la historia o por el test-retest, sino iguaÍadas, una :nedida antes y después de la exposición Y la
que podrfan deberse a diferencias en el reclutamiento de un otra medida solo después ella, como en ()4. Este ~egundo
nfío a otro ( corno se indica por medio del signo negativo en grupo permite una comparac!ó.~, s_o~r~ muestras cu1dad?sa-
«Selección») o a la circunstancia de que los participantes eran mente igualadas, de una med1c1on 1111c1al «antes y des pues»;
un afío mayores ( signo negativo en «Maduración»). Cuando es más precisa que la comparación 01 - (?2 en lo que respecta
todas las pruebas se realizan durante el mismo período, pare- a la selección, y superior a la c?mparac1ón 02 - Oa, Yª, que
ce improbable que haya una variable entremezclada de instru- evita los efectos de test-retest. El efecto de X queda as1 do-
mentación o desvíos en la índole del instrumento de medición. cumentado por medio de tres comparaciones distintas,
En la típica comparación de las diferencias de actitud entre 01 > 02, 02 < 03 y 02 < 0.1. ,
alumnos universitarios de primero y segundo año, el efecto de Nótese, sin embargo, que 02 apar~ce en l!s tres, razo'.1 por la
la mortalidad no pasa de ser una explicación rival: 0 1 y 0 2 po- cual todo ello podría parecer conf1~mator10 soio en v1rt1;1d de
drían diferir solo a causa del tipo de personas que han aban- una actuación excéntrica del mencionado con¡unto particular
donado sus estudios en la Clase A, pero continúa teniendo de mediciones. La introducción de 05, o sea la Clase C, pro-
representación en la B. Este inconveniente se puede evitar si bada en ocasión del segundo test antes de ser expuesta a X,
las reacciones se identifican por individuos y el experimenta- ofrece una nueva medición pre-X que puede compararse con
dor espera antes de analizar sus datos a que la Clase B haya 0.1 y 0 1 , etc., brindando una redundancia necesaria. La divi-

112 113
sión de la Clase' B hace esta comparación de 0.1 05 más clara la época de las pruebas. Para confirmar la hipótesis de un
que fo que sería una Oa - º"· Adviértase, empero, que la di- efecto de X, los grupos Oo y O, deberían ser iguales, o al me-
visión de una clase en dos mitades, sometida una a test y la nos acusar una discrepancia menor que las comparaciones
otra no, suele constituir un dispositivo reactivo. Por eso se que abarcan la exposición a X. La selección de tales controles
ha. incluido un signo de interrogación para ese factor en la poblacionales generales dependería de lo específico de la hi-
fila 0:; < 04 del cuadro 3. Que sea o no un procedimiento pótesis. Dado nuestro conocimiento acerca de la universal
reactivo depende de las condiciones concretas. Cuando se importancia de las consideraciones de clase social y educación,
echan suertes y se pide que la mitad de la clase pase a otra esos controles podrían seleccionarse de tal modo que equipa-
aula, es probable que el procedimiento sea reactivo [p. ej., rasen el reclutamiento institucional con la clase social y la
Duncan y otros, 1957; Solomon, 1949]. Cuando, como sucede educación anterior. Asimismo, podrían ser personas que vi-
en muchos estudios sobre militares, las entrevistas se han rea- vieran fuera de sus hogares por primera vez y que tuviesen la
lizado en forma individual, una clase puede dividirse en mi- edad típica de búsqueda de independencia; así en el ejemplo
tades iguales sin que el hecho resulte tan ostensible. Cuando dado, el grupo 06 habría estado lejos de su casa durante un
un curso está formado por un cierto número de divisiones año, y el 01 estaría a punto de abandonarla. Esos controles
con programas diferentes, hay la posibifübd de asignar esas de relación de edad en la población general serían siempre
unidades intactas a los grupos con pretest y sin él [p. ej., hasta cierto punto insatisfactorios y constituirían el rubro
Hovland, Lumsdaine y Sheffiel<l, 1949]. Para una clase única, más costoso, ya que la aplicación de pruebas dentro del
el recurso de distribuir cuestionarios o tests a todos, pero vtt- esquema de una institución es por lo común más simple que
riando el contenido a fin de que una mitad aleatoria obtenga seleccionar casos de una población general. Por esa razón,
lo que constituiría el pretest y la otra se pruebe con algún Oo y Or han sído programados con la segunda tanda de prue-
otro instrumento, puede servir para lograr que la división del bas, pero si no resulta ningún efecto de X en el primer con-
curso no sea más reactiva que el test de la clase total. junto de resultados ( la comparación 01 > 02), tan costosos
El diseño, tal como se lo representa por medio de las medi- procedimientos estarían por lo común injustificados ( a menos,
ciones 01 a Or, falla siempre en el control de la maduraci6n. claro está, que se propugnase la hipótesis de que la X insti-
La gravedad de esa limitación variará de acuerdo con el m,tte- tucional había eliminado un proceso normal de maduración).
rial que se investigue. Si el experimento versa sobre la adqui- Otro enfoque por corte trasversal del control de la maduración
sición de una habilidad o técnica muy poco común, la hipó- puede darse si hay heterogeneidad de edades ( o un cierto
tesis rival de maduración -que el simple hecho de envejecer número de años fuera del hogar, etc.) dentro de la población
o de adquirir experiencia gracias a las prácticas sociales co- que ingresa en el ciclo institucional. Así ocurriría en muchas si-
tidianas habría producido esa habilidad- puede resu.ltar su- tuaciones; por ejemplo, al estudiar los efectos de un curso
mamente improbable. universitario aislado. En este caso, las mediciones de 02 po-
Sin embargo, en el citado estudio de actitudes hacia superio- drían subdividirse en un grupo de mayor y otro de menor
res y subalternos [ Campbell y McCormack, 1957], el desvío edad, a fin de examinar si esos dos subgrupos ( 020 y 02v en
fue tal que bien podría explicarse a causa de la mayor pre- el cuadro 3) diferían como lo habían hecho 01 y 02 ( aun-
paración que, casi en cualquier contexto, habría adquirido un que la universal correlación negativa entre edad y capacidad
grupo de aquella edad y tipo particular de ambiente al crecer dentro de los grados escolares, etc., introduce aquí no pocos
en edad o estar lejos ele sus hogares respectivos. En tal situa- peligros). Mejor que el control con los coetáneos de toda la
ción parece imprescindible un control de maduración. Por ese población, la comparación podría hacerse con otra institución
motivo se han agregado OG y 01 al diseño, a fin de ofrecer determinada, por ejemplo, entre los conscriptos de la Fuerza
una prueba de corte trasversal de una hipótesis general de Aérea y los estudiantes universitarios de primer año. Si se ha
maduración hecha en ocasión del segundo período de test,. ele hacer una comparación de esta índole, se reduce la varia-
Ello exigirá someter a prueba a dos grupos de personas de la ble experimental a aquellos aspectos que ambas instituciones
población general que solo difieran en la edad, la cual se ele- no tienen en común. En tal caso, es probable que los diseños
giría a fin de que coincidiera con las de las Clases B y C en 10 y 13, por lo común más eficaces, sean igualmente factibles.

114 115
Los requisitos formales de este diseño parecen aplicables in- neidad. No obstante, difícilmente podría aceptarse la expli-
cl_u_so a un problema como el de la psicoterapia. Esta posi- cación desde el punto de vista de la historia sí ambas com-
b1ltdad revela cuán difícil es una verificación correcta de la paraciones acusaran el efecto, como no fuera postulando una
variable maduración. Comoquiera que se elijan los controles serie bastante compleja de coincidencias.
poblacionalcs para una situación de psicoterapia, si no reciben N6tese que ninguna tendencia histórica general, como la que
este tipo de tratamiento diferirán en aspectos importantes. sin duda :hallamos en las actitudes sociales, se confunde con
Aunque estén tan enfermos como los sometidos a tratamien- resultados experimentales concretos. Una tendencia de esa ín-
to psicoterapéutíco, es casi seguro que diferirán en su cono- dole colocaría a 02 en posición intermedia entre 01 y Ü3,
cimiento de él, así corno en sus creencias al respecto y su mientras que la hipótesis de que X tiene un efecto exige que
fe en ese procedimiento curativo. Un grupo de esta índole, 0 1 y 0:i sean iguales y O:i difiera de ambas en el mismo sen-
enfermo pero optimista, podría muy bien tener posibílidades tido. En general, si se repite varias veces el experimento,
de recuperación típicas de cualquier grupo de comparación es poco probable que la confusión con la historia constituya
que pudiésemos echar mano y, por consiguiente, podría un problema, ni siquiera en esta versión del diseño. Pero,
m,1linterpretarse una interacción de selección y maduración para ciclos institucionales de menos de un año, habrá posibi-
como un efecto de X. ' lidad de confusión con variaciones estacionales en actitudes,
Para el estudio aislado de procesos de desarrollo, el no poder moral, optimismo, inteligencia, etc. Sí la X es un curso desa-
controlar la maduración no es, ciertamente, un inconveniente, rrollado solo en la temporada de otoño,"' y entre setiembre y
ya que ella es el objetivo mismo del análisis. Esa combina- enero la gente suele experimentar mayor agresividad y pesi-
ción de comparaciones longitudinales y de corte trnsversal de- mismo a causa de los factores climáticos de la estación, esa
bería emplearse en forma más sistemática en este tipo de es- tendencia estacional recurrente se confundirá con los efectos
tudios. El estudio aislado de cortes trasversales confunde ma- X en todas sus manifestaciones. Para situaciones de esta
duración con selección y mortalidad. El estudio longitudinal índole pueden utilizarse, y resultan aconsejables, los diseños
confunde maduración con aplicación reiterada de tests e histo- 10 y 13.
ria. Por sí solo no es probablemente mejor que el de corte Si las comparaciones de corte trasversal y longitudinales indi-
t~a.sversal, aunque su costo más elevado le otorga mayor pres- can efectos análogos de X, ello sería inexplicable como
t1g10. La combinación de ambos, quizá con reiteradas com- interacción entre la maduración y las diferencias de selección
paraciones de cortes trasversales en diversos momentos pa- entre las clases. No obstante, se ha dejado en blanco la co-
rece ideal. ' lumna porque este control no aparece en las presentaciones
Tal como se presentan los esquemas del diseño 15, se supone fraamentarias del cuadro 3. Las calificaciones de los criterios de
que se podrá aplicar el postest a un grupo al mismo tiempo validez externa se ajustan en general al esquema de los di-
que el pretest a otro. No siempre ocurre así en situaciones seños anteriores que contienen los mismos fragmentos. Los
en que tal vez se descara utilizar este diseño. La signíente es signos de interrogación en la columna «Interacción selec-
una representación más precisa del caso típico en la situación ción y X», advierten simplemente que los descubrimientos se
escolar: limitan al ciclo institucional que se estudi,1. Dada la com-
plejidad de X, es posible que se realice la investigación por
Clase A X 01 razones prácticas más que con propósitos teóricos, y tal vez
se quiera en este caso generalizar a una institución en par-
Clase B1 R02 X Oa ticular.
Clase B2 R X 01
Clase C

Este diseño carece del claro control sobre la historia c:n laé'
comparaciones 01 > 02 y O,> Ori, por falta de simulta- * Vale decir, la primera en el hemisferio Sur. (N. del E.)

116 117
16. Análisis de discontinuidad en la regresión ría tm experimento propiamente dicho. Tales experimentos
son factibles y habría que realizarlos.
Este diseño es practicable en una situación en que se han El diseño cuasiexperimental 16 trata de establecer ese expe-
utilizado ya diseños ex post facto. Aunque de muy limitada rimento propiamente dicho examinando la línea de regresión
aplicación, parece justificado presentarlo aquí por el hecho para una discontinuidad en el punto de corte, claramente im-
de que esas situaciones poco numerosas son, en su mayor plkita en la hipótesis causal. Si el resultado fuese como el
parte, educacionales. También parece oportuno incluirlo co- diagramado y los círculos de la figura 4 representasen extra-
mo ejemplo de la conveniencia <le indagar, en cada situación pobciones lle las dos mitades de la línea de regresión, y no
concreta, todas las implicaciones de una hipótesis causal, bus- un experimento de solución de empate dividido al azar, la
cando nuevos afloramientos de esta última, mediante los cua- prucha del efecto sería casi tan incontestable como en el
les se la pudiera verificar. La situación que tomaremos [This- experimento propiamente dicho.
tlethwaite y Campbell 1960 J consiste en el otorgamiento de
prernios a los aspirantes más calificados, sobre la base de un Figura 4. Análisis de discontinuidad en la regresión.
puntaje de corte dentro de un conjunto cuantificado de cali-
ficaciones. El premio puede ser una beca, el ingreso en una uru-
versidad tan prestigiosa que todos los aprobados se inscriben Desempeño posterior, O
en ella, u.n año de estudios en Europa, etc. Después de ese
acontecimiento, tanto los solicitantes que reciben el premio
como los que no lo obtienen son objetos de mediciones res-
pecto de varias O que representan logros, actitudes, etc., pos-
teriores. Se plantea entonces el interrogante de si el premio
provoca alguna diferencia. El problema de inferencia es difí-
cil porque casi todas las cualidades que acreditan a un alum-
no para el premio ( salvo, a veces, otros factores, como sus
necesidades económicas y el estado en que reside) son las mis-
mas que habrían llevado a un mejor desempeño en esas O.
Tenemos casi la certeza anticipada de que los premiados ha-
brían obtenido puntajes superiores en las O que quienes no lo
fueron, aunque no se :hubiesen otorgado los premios.
La figura 4 presenta el tema del diseño. Ilustra la relación 60 70 80 90 100 110 120 130 140 150
prevista entre capacidad pre-premio y rendimientos posterio-
res, más los resultados adicionales de las oportunidades edu- Puntajes en los cuales influyó el premió
cacionales o motivacionales consiguientes. Consideremos ante
todo un experimento propiamente dicho del tipo del diseño Algunos de los tests de significación estudiados en el diseño
6, con el cual contrastaremos nuestro cuasiexperimento. Ese 7 son también aplicables aquí. Nótese que la hipótesis es a
experimento propiamente dicho podría racionalizarse como un todas luces de diferencia de ordenada más que de pendien-
proceso de solución de empate, o como un experimento adi- te, y que el paso tiene gue estar localizado en el punto X de
cional, en el que, para una estrecha amplitud de puntajes la línea de regresión: cualquier «desfasaje» o «dispersión» es
en el punto de corte o por debajo pero muy cerca de él, la incompatible con la hipótesis. Son, pues, apropiadas las prue-
asignación aleatoria daría lugar a un grupo experimental ga- bas paramétricas y no paramétricas que evitan supuestos de
nador del premio y un grupo de control no ganador. Es de linealidad. Nótese asimismo que tales supuestos son por lo
presumir que tales grupos tendrían un desempeño similar al común más aceptables para los datos de regresión que para
representado por los dos círculos en la línea de corte de la series cronológicas. ( Con determinados tipos de datos, como
figura 4. PJ1ra esa estrecha amplitud de capacidades, se logra-

118 119
los porcentajes, puede ser necesaria una trasformación línea]}. el grupo experimental y el de control, historia y maduración
Tal vez sea conveniente efectuar una prueba t vinculada con estar controladas. La administración de tests como
la diferencia entre los dos puntos linealmente extrapolados. principal también lo está, pues tanto el grupo experi-
Acaso el test más eficaz fuera un análisis de covariancía, en mental como el de control la han recibido. Los errores de
el cual el puntaje de decisión de otorgamiento del premio instrumentación bien podrían plantear un problema si la O
sería la covaríablc de los rendimientos ulLeriorcs, y el trata- de seguimiento se realizase bajos los auspicios determinant<:s
miento estaría representado por la adjudicación o no adjudi- del premio, en el sentido que la gra'.ttud p~)t hab_erlo ~eCl-
cación del premio. bido y el resentimiento por lo. contrario pudieran inducir a
¿Es probable la aplicación de este tipo de disefío? Sin duda distintas manifestaciones de actitud, mayor o menor exagera-
alguna se refiere a una situación recurrente en la cual abun- ción del éxito alcanzado en la vida, etc. Este defect~ se ob-
dan las afirmaciones en favor de la eficacia de X. ¿Vale la servaría asimismo en el experimento propiamente dicho de
pena verificar esas afirmaciones? Un s,1erificio necc;;31rio es solución de empate. Podría controlá:selo ha.de1:do . 9ue _los
que todos los elementos que entran en la decisión J-inal se seguimientos los efectmua otro orgamsrno o 111st1tuc1on dife-
combinen en un índice compuc:sto, determinando con íiitidcz rente. Creemos, conforme a los argumentos que anteceden, que
el punto de corte. Pero estamos convencidos de que todos lus tanto la regresión corno la selección están cont.roladas e? lo
factores que influyen en una decísión -el aspecto que presen- que atañe a sus posibles contribuciones espur.1as a la i_t~fe-
ta la fotografía, la jerarquía del curso deducida de la reputación rencia, aun cuando la selección sea sesgada y exista regresmn:
ele la escuela secundaria, las rclacionc:s del padre con los di- ambas han sido controladas al representárselas en detalle, no
rectivos del establecimiento, etc.-, pueden incluirse en un mediante la igualación. La mort,~lidad constítu~rfa un pr<:-
índice de esta índole, por medio de puntajes, si no se blema si fuese el ente de otorgamiento del premw el que di-
cuenta con un medio más directo. También deberíamos estar rigiese la medición de seguimiento, pues quienes lo recibie-
ya convencidos [Meehl, 1954] de que nna fórmula de pon- ron, los ex alumnos, etc., cooperarían probablemente con
deración correlacional múltiple para la combinación de los mucha mejor disposición que los no ganadores. Nótese cómo
elementos ( aun empleando como criterio decisiones ante- el deseo, por lo común conveniente, dd i?vestigador de ,lo-
riores del comité de selección) suele ser mejor que las pon- grar que la muestra selecci?nada sea ~J,ien repres:nt~tlva
deraciones de un comité en cada caso particular. Nada perde- puede inducir aquí a error. Si la conducc10n del se_gmmiento
ríamos, pues, y mucho se podría ganar en todo sentido, cuan- con un membrete distinto provocara una reducción en la
tificando las decisiones de todo tipo relativas al premio. De cooperación, por ejemplo, del 90 al ?º % , el expe1}mentador
prnceder así, y si se llevasen registros de otorgamientos y tal vez se resistiese a hacer el camhw, que el tiene como
rc:chazos, cabría hacer un seguimiento de los efectos varios meta una representación del 100 % los ganad?r~s del
años después. premio. Es posible que olvide que _su _verdadero (~b1et1vo es
Acaso convenga relatar aquí una parábola verídica. Una ge- obtener datos interpretables, que nmgHn dato es mterpreta-
nerosa fundación, interesada en mejorar Ia educación supe- ble si está aislado y que es imprescindible contar con un
rior, donó a una universidad de Estados Unidos medio mi- grup,o de contrast~ sinÍilar a fi~ de utilizar la inf.ormación
llón de dólares para que estudiase los efectos de la escuela que posee sobre los. ganadores. rinto ~º~ este mot~vo como
sobre sus alumnos. Diez años después no había aparecido un por el problema de .111st,r~1mentac1on, qt)i7;a f1;1ese meJ<?r desde
solo informe ni siquiera remotamente relacionado con el tema. el punto de vista c1ent1fico tener auspioos mdepend1entes y
¿Tomaron con alguna seriedad los donantes o los favorecidos un 50 % de respuestas de ambos grupos en vez de un 90 %
con la donación las especificaciones de la propuesta formal? de los ganadores y un 50 % de los no ganadores. Una vez
,;Existía alguna respuesta posible al interrogante propuesto? más, el problema de la 11:ortalidad se~~a el mismo • el
Los diseños 15 y 16 parecen ofrecer las únicá, aproximaciones experimento propiamente dicho ~e solucion de <:mpat_e. am-
viables. Pero, por supuesto, quizá ningún científico sienta bos casos, la amenaza que implica para la validez mterna la
verdadera curiosidad por los efectos de una X tan global. interacción selección-maduración queda controlada. En cuanto
V camas el análisis del cuadro 3. A causa de la sincronía entre al cuasiexperimento, se lo controla en el sentido de que esa

120 121
Íl~terac~ió~ no podría dar una explicación lícita de una clara
d1scont1t:mcbd de la línea de regresíón en X. La antC:'naza 6. Diseños corrclacionales y «ex post
d la yal1dc% externa de una interacción aplicación de pnie- facto»
bas-~- queda controlada, a su vez, en la medida en que las
rned1crones ~undamentales utifoadas al decidir la adjudicación
,del premio In legran el 111:ivcrso al cual se quiere generalizar.
f anto, ~l _verdad~ro expcr!mento de solución de empate como
el _analis1~ de d1scontrnu1dad de regresión están partícular-
rnentc ':l;Jctus a la lírnitación de la validez cxicrna por fa
mtera<.:c1on selección-X, ya que el efecto sólo ha quedado Una de bs dimensiones de «cuasída<l>> ( quasiness) que ha
demos~rada, con respec10 a una gama mt1y estrecha de talentos ido en aumento a lo largo de los últimos nueve diseños es
es decir, sol~ para los situados en el puntajc ele corte Er; Ja mcdid,1 en que X pod1:¡a ser manipulnda por el experimcn-
el rn:1s 1exp'.:nmcnt'.i, Lis posibilidades de inferencia t;1] vez Lt<lor, es decir, en que podría introducír,cla en el curso nor-
parezcin mas _amplt~s, pero nótese que los inconvenientes del mal de los acontecimientos. Por supuesto, cuanto más ocurre
supuestude aJuste hnenl son mínimos nrnndo se los extrapola así, más cerca se está de la experimentación propiamente di-
s'.1 Lirnenle ;t un p111110, comu en el dtsciío ilustr:,do ,: 11 ]a cha, como hemos ido viendo, en partícubr con rcfcrenci:1 a
hg~;ª 4. G~neralizaci~1nes más amplias implican la extrapo- los diseños 7 y 10. Los diseños 7, 10, 12, 13 (pero no 13a)
lac10n del a¡uste deba¡o de X a través de toda la gama de y 14 serfan aplicables tanto para X producidas en forma natu-
valores ele )f, 'V t:n c1cb grado 1nayor de extr.ipolación au- ral como ¡i:tra las introducidas de propósito por el l'xperimcn-
menta_ el nu~ucro .1e hipótesis rivales aceptables. También t:,dor. Los disef1os serían más sospechosos cuando la X no
,mme_nrn la dispersión de los valores extrapolados de diferen- estuviese controlada, y algunos qLLe acaso estuvieccn dispues-
tes, tipos de curvas ajustadas a los ,·:dores inferiores a X tos a denominar cnasiexperimentos n las versiones controla-
ctcclcra. ' das por el cxpcriment:1dur, taJ vez no quisieran aplicar este
término a la X no controlada. No es nuestro ánimo hacer
una cuestión por ello, pero sí destacar el valor de los arnílisis
de datos de tipo experimental para X no contn.>bdas, cu
comparación con los ensayos evaluativos y los análisis enga-
úosos que con demasiada frecuencia se emplean en tales si-
tuaciones. Es evi,knte que el diseño 15 está del todo limitado
a una X natural, y los diseüos de cst,1 sección ( auüquc se
los denomine de análisis de datos y no cuasiexperiment:1les)
se hallan enclavados aún más en la situación natural. En este
capítulo comenzarnnos ck nuevo con el análisis corrdacíonal
simple, veremos a continuadéin dos discüos bastante acepta•
bles, y retornaremos por último a los experimentos ex post
far-to, que· se con~iclcran en e! mejor de lns casos insatisLic-
torios.

Correlación y causaciún

El diseño 3 es nn diseñu correlacional muy en.lrble, puesto


que implica la comparación de so!,J do,: unidades natur.des,
que difieren en la presencia y ausencia de X, así como tam-

122
!23
bién en muchísimos otros atributos. Cada uno de ellos podría la antecedencia-consecuencia temporal de una relación causal
crear diferencias en las O, y por lo tanto cada uno ofrece una es imprescindible realizar observaciones a lo largo del tiempo,
hipótesis aceptable, opuesta a la de que X ha producido cuando no apelar a la introducción experimental de X. Sí se
un efecto. Nos queda una regla general: que las diferencias correlaciona, por ejemplo, el comportamiento del maestro y el
entre dos objetos naturales no son interpretables. Considere- alumno, nuestros estereotipos culturales casi nunca nos per-
mos ahora esta comparación dilatada hasta el punto en que mitirán considerar la posibilidad de que el comportamiento
dispongamos de muchas situaciones naturales independientes del segundo provoque el del primero. Aun en una situación
de X y muchas otras también de no-X, así como diferencias natmal, parece hallarse implícita una prioridad temporal, y
concomitantes en O. En la medida en que las situaciones na- los procesos selectivos de retención pueden determinar una
turales de X varíen entre sí en sus demás atributos, esos otros causalidad en sentido contrario. Consideremos, por ejemplo,
atributos se tornarán menos aceptables como hipótesis rivales. posibles confirmaciones de cpc los inspectores que tienen a
Pneden establecerse, así, correfacioncs de naturaleza especta- su cargo las mejores escuelas son los más cultos y que las es-
cular, como las postu,ladas entre los fumadores empeder- cuelas con frecuentes cambios de inspectores tienen una mo-
nidos y el cáncer de pulmón. ¿Cuál es la jerarquía de esos da- ral colectiva más escasa. Es casi inevitable que extraigamos la
tos como prueba de causación análoga a la suministrada por consecuencia de que el nivel educacional de los inspectores y
la experimentación? directivos estables causan mejores escuelas. La cadena causal
Cabe ante todo hacer una reflexión positiva. Esos <latos son bien podría ser a la inversa: las escuelas mejores ( por el mo-
pertinentes <1 las hipótesis causales en la medida en que las ex- tivo que fuere) podrían ser la causa de que los hombres me-
ponen a la refutación. Si se obtiene una correlación nula, se jor educados permanecieran en ellas, mientras que las peores
reduce la admisibilídad de la hipótesis. Si se produce una co- podrían inducirlos a que se sintiesen tentados a cambiar su
rrefación elevada, su admisibilidad es mayor, ya que ha sobre- puesto por otro mejor. De igual modo, fas escuelas mejores
vivido una posibilidad de refutación. Planteado el asunto en podrían hacer que los inspectores se quedaran más tiempo en
otra forma: la correlación no indica necesariamente causacíón, sus cargos. Aun más universal que la engañosa correlación
pero una ley causal del tipo que produce diferencias medias inversa es la de una tercera variable, también conducente a
en los experimentos implica correlación. En cualquier experi- error, de que los determinantes lícitos de guíen está expues-
mento en que X aumente a O, se hallará una correlación bi- to a X son de tal naturaleza, que producirían asimismo eleva-
serial positiva entre la presencia-ausencia de X y los puntajes dos puntajes de O, aun sin la presencia de X. Volveremos so-
postest o los de ganancia. La ausencia de esa correlación pue- bre estos casos en el apartado final, acerca del diseño ex post
de eliminar muchas hipótesis causales simples y generales, re- facto.
lativas a los efectos principales de X. En este sentido, el en- El experimento propiamente dicho sólo difiere de la situación
foque correlacional, relativamente poco costoso, quizás ofrezca correlacional en que el proceso de aleatorización destruye cual-
una revisión preliminar de hipótesis, y las que sobrevivan a quier relación lícita entre el carácter o los antecedentes de los
ese proceso podrán verificarse entonces por medio de la más alumnos y su exposición a X. Donde se tienen pretests y no
onerosa manipulación experimental. Katz, Maccoby y Morse se dispone de una clara determinación de quiénes estuvieron
[ 1951] han defendido esta tesis, ofreciendo una secuencia en expuestos y quiénes no, quizá sean convincentes, aun sin la
la que los efectos del liderazgo sobre la productividad se estu- aleatorización, los diseños 10 y 14. Pero para qu.e un diseño
diaron primero en forma corre1acional, tras lo cual se verificó, que carece de pretest ( imitando al 6) se produzca en forma
por experimentación, una importante hipótesis [Morse y Rei- natural se requieren circunstancias muy especiales, que casi
rner, 1956]. nunca se dan. Así y todo, de acuerdo con nuestra tesis general
Si pasamos revista a las investigaciones sobre educación, pron- relativa al aprovechamiento oportuno de las situaciones que
to nos convenceremos de que son más los casos en que la in- ofrezcan datos interpretables, conviene estar alerta y con los
terpretación causal de la información correlacional se exagera ojos bien abiertos por si acaso se presentan, Esas situaciones
que aquellos en que se la desconoce, así como que suelen pa• serán aquellas en que parezca aceptable que la exposición a X
sarse por alto hipótesis rivales aceptadas, y qu.e para establecer no se sujete a regla alguna, sino que sea arbitraria y sin

124 125
correlación alguna con otras consideraciones. En teoría, esas causal de los interesantes descubrimientos, como tampoco lo
decisiones de exposición arbitraria serán también muchas e i'.1- es la causación inversa de la personalidad del niño respecto
dependientes entre sí. Además, hay que sustentarlas por medio al sexo de su hermano.
de cualquier otro tipo de prueba de que se disponga, por dé-
bil que sea, como en el pretest retrospectivo que analizamos
más adelante. Como lo han sostenido en parte Simon [ 1957, El pretest retrospectivo
págs. 10-61] y Wold [ 1956], la interpretación causal d~ una
correlación simple o parcial depende tanto de la presencia de En muchas situaciones militares de tiempos de guerra, puede
una aceptable hipótesis causal compatible como de la ausen- ocurrir que la asignación de hombres de igual rango y espe-
cia de hipótesis rivales lógicas para explicar la correlación so- cialización a distintas unidades se haga por medio de procesos
bre otros fundamentos. caóticos, sin consideración alguna a privilegios, preferencias o
Un estudio correlaciona] de esta índole es tan admirablemen- capacidades especiales. Una comparación entre las actitudes
te oportuno que merece destacárselo. Barch, Trumbo y Nangle de blancos que se asignaron a unidades de infantería racial-
[ 1957] utilizaron como X la presencia o la ausencia de mente mixtas y las de aquellos destinados a otras integradas
scfiales ele giro en el automóvil que iba delante, la presencia solo por blancos puede resultar de interés por sus determina-
o ausencia de las mismas sefiales en el auto posterior como O, ciones causales [Information and Education Division, 1947].
y demostraron un significativo efecto de imitación, determi- No podemos, sin duda, hacer caso omiso de estos datos, sino
nación de patrones o conformidad que concordaba con mu- más bien buscar información complementaria a fin de elimi-
chos estudios de laboratorio. Careciendo, como se carecía, de nar hipótesis rivales aceptables, sin perder conciencia de las
un pretest, la interpretación dependió del supuesto previo demás fuentes de invalidación. En aquel caso la entrevista
de que no hay relación entre las tendencias a marcar el gi_ro «postest», no solo contenía información sobre las actitudes
en los mencionados automóviles, independientemente de la 111- corrientes hacia los negros ( más favorables en las compa-
fluencia ejercida por el comportamiento del automóvil que ñías mixtas), sino que además requería que se recordasen las
lleve la delantera. Tal como se publicó, la información parecía actitudes anteriores al destino actual. Aquellos «pretests re-
convincente. Nótese, sin embargo, que cualquier tercer varia- trospectivos» no arrojaron diferencia alguna entre ambos grt1r
ble que hubiera influido en forma similar sobre la frecuencia pos, aumentando así la posibilidad de que antes de la asigna-
Je señales de ambos pares de conductores se habría converti- ción al destino no hubiera existido ninguna disparidad.
do en hipótesis rival aceptable. Por ende, si las condiciones Un análisis parecido resultó importante en un estudio realiza-
atmosféricas, el grado de visibilidad, las actitudes del con- do por Deutsch y Collins [ 19 51] comparando los ocupantes
ductor tal como son afectadas por la hora, la presencia de un de un barrio formado por unidades integradas con los que
automóvil policial estacionado, etc., influyen sobre ambos con- ocupaban unidades segregadas, en momentos en que la escasez
ductores, y si se combinan los datos provenientes de condi- de viviendas era tal, que cabía presumir que la gente había de
ciones heterogéneas en tales terceras variables, la correlación tomar cualquier comodidad disponible, con prescindencia casi
puede explicarse sin necesidad de suponer efecto alguno pro- total de sus actitudes. Teniendo tan solo mediciones postest,
ducido por el hecho aislado de que el auto que va delante haga podría haberse considerado que las diferencias que descubrie-
la señal. Más importante como «diseño 6 natural» es el infor- ron reflejaban sesgos de selección sobre actitudes iniciales.
me de Brim [ 1958] acerca del influjo del sexo del hermano La interpretación de que la experiencia integrada provocó las
sobre la personalidad de un niño en una familia que tiene dos actitudes más favorables se vio fortalecida cuando un pretest
hijos. La determinación del sexo puede ser una lotería casi retrospectivo indicó que no había diferencias entre los dos ti-
perfecta. Hasta donde hoy se sabe, no guarda correlación al- pos de grupos de vivienda en actitudes anteriores que se re-
guna con los determinantes familiares, sociales o genéticos de cordaran. Dados los factores autistas que, según se sabe dis-
la personalidad. La codeterminación de una tercera variable del torsionan la memoria y los informes de las entrevistas, tales
sexo del hermano y la personalidad de un niño no es por el datos nunca pueden ser decisivos.
momento una hipótesis rival aceptable para la interpretación Deseamos intensamente poder trabajar con la entrevista de

126 127
pretest de entrada ( y también con la asignación aleatoría a son pruebas muy superficiales del efecto conseguido. Intro-
tratamientos de los moradores). Tales estudios, sin duda al- ducen un nuevo factor que atenta contra la validez interna:
guna, se ~stán realizando. Pero hasta que se los sustituya por la errónea clasificación sesgada de exposición a que no nos
o~ros meior fundados los descubrimientos de Deutsch y Co- molestamos en íncluír en nuestros cuadros.
llms, entre ellos el prctcst retrospectivo, son contribuciones En la metodología de la encuesta, se gana mucho con la in-
preciosas a una ciencia de orientación experimental en este troducción del método de panel, consistente en la repetición
difícil terreno. de cn_trevistas con las mismas personas. B~en practicados, los
El l?ctor 1:10 1cbe pasa_r por alto que es probable que la me- estud10s en panel parecen ofrecer datos útiles para la versión
morta se mchne a dclormar las actitudes pasadas a fin de más endeble del diseño 10, con X natural, cuando en-
que concuerden con lns actuales, o con lo que el morador ha tre las dos tandas de entrevistas o cuestionarios interviene al.
llegado ~ considerar actitudes socialmente deseables. Parece, agente de variación, como una película cinematográfica
pues: _mas probable que en tales casos el sesgo de memoria o un contacto de asesoramiento. El estudiante de ciencias
se dIS1mule, en vez de disfrazarse, como efecto signíHcativo de la educación debe saber, sin embargo, que dentro de la
de X. sociología . esa importante innovación metodológica suele ir
Si se continúa con los estudíos comparativos de actitudes de acompañada por una engañosa tradición de análisis. La «tabla
los alumnos universitarios de primero y último año para de- rotativa» [Glock, 1955], que es una tabulación cruzada con
mostrar la influencia de la institución, parece conveniente e1 porcentajes computados con respecto a subtotales tomados co-
us<: de pretests ~·et~os1:ectívos en apoyo de las demás compa- mo base, está muy sujeta a la confusión interpretativa de efec-
r~c1on_cs como lim1tac1ón parcial de las hipótesis rivales de tos de regresión con hipótesis causales, según lo señalaron
h1~tona, mortalidnd selectiva y desvíos en la selección inicial. Campbell y Clayton [ 1961]. Au.n cuando se analice desde el
( _Ello no quiere decir que apoyemos ninguna repetición adi- punto de vista de las ganancias pretest-postest para un grupo
c10~1al de tales estudios de corte trasversal, cuando lo que ne- expuesto frente a otro no expuesto, continúa existiendo otra
cesitamos son más estudios longitudinales, como los de New- fuente más sutil de sesgo. En esta modalidad de estudio en
c~)mb [ 194 3], ,que ofrece mediciones repetidas duran te el pe- pa_n~l, la _exposición a la X (p. ej., una película contra los pre-
rtodo de cuatro años, completadas en varias encuestas de corte Ju1c10s vista por mucha gente) se establece en la segunda
trasversal en la forma común de una extensión a cuatro años t~nda del panel en dos tandas. El diseño tiene el siguiente
del diseño 15. Que las tesis de doctorado necesariamente diagrama:
urgidas por el tiempo, se escriban sobre ot;os temas.)
'O) (XO'
.. (. . . . . . . ? ' .. ) ..
Estudios en panel \o' o

Las encuestas más simples recogen observaciones realizadas


e? un solo punto del tiempo, que a menudo ofrecen al parti- DiseFio en panel con dos tandas (inaceptable)
c1pante la oportunidad de autodasificarse como expuesto o no
a X. A la_s correlaciones de exposición y postest que así resul- Aquí, los paréntesis indican la ocurrencia de O o X en la
tan contr1buye no solo el sesgo causal común ( en que los de- misma entrevista; el signo de interrogación, ambigüedad de
terminantes de quién recibe X también causarían aun sin X clasificación en grupos X y no-X. A diferencia del diseño 10
elevados puntajes de O) sino también una díst~rsión de ¡; la X está correlacionada con las O del pretest ( en que los d~
mem<::ria con respecto a X, dando mayor a la aparición menos prejuicios realizan los mayores esfuerzos por ir a ver
espur:a de c~us,a [Stouffer, 1950, pág. 356]. Aunque estos la película). Pero, además, aunque X no hubiera tenido nin-
e?~udtos contmuan apoyando las inferencias causales que jus- gú~ efecto real sobre O, la correlación entre X y los postests
t1ftcan los presupuestos publicitarios ( correlaciones entre sena mayor que entre X y el pretest solo, porque se producen
«¿Vio usted el programa?» y « ¿Compra usted el producto?»), en la misma entrevista.

128 129
En la investigación con pruebas y mediciones es bastante El cuadro de dieciséis partes de Lazarsfeld
habitual que se observe una mayor tendencia a la correlación
entre dos puntos cualesquiera incluidos en el mismo cuestio- Otra ingeniosa aplicación cuasiexperimental de la información
nario que si se encontraran en distintos cuestionarios. Stock- de panel, introducida por Lazarsfeld alrededor de 1948 en
ford y Bissell [ 1949] comprobaron que los ítems adyacentes un informe mimeografiado titulado «The mutual effect of sta-
se correlacionaban más que los no adyacentes, incluso en el tistical variables» ( El efecto mutuo de las variables estadís-
mismo instrumento. Las pruebas administradas en el mismo ticas), tuvo por objetivo en un primer momento la obtenci-5n
día tienen mayor correlación que aquellas que se aplican en de un índice del sentido ( y fuerza) de la causación exis-
días distintos. En el estudio en panel que comentamos [Glock, tente entre dos variables. Ese análisis se designa en la actua-
19 55], ambas entrevistas se produjeron con unos 8 meses de lidad con el nombre de «Cuadro de dieciséis partes» [p. ej.,
intervalo. Las fuentes de correlación que destacan las que apa- Lipset, Lazarsfeld, Barton y Linz, 1954, págs. 1160-63], y
recen en una misma entrevista y oscurecen las existentes en se emplea por lo común para averiguar la fuerza o profundi-
entrevistas separadas no solo incluyen fluctuaciones autóno- dad relativa de varias actitudes, más que para inferir el «sen-
mas en los prejuicios, sino también diferencias en los entre- tido de causación». Este último propósito es el que lo con-
vistadores. Los inevitables errores cometidos por el entrevis- vierte en cuasiexperimental.
tador, así como las inexactas manifestaciones del entrevistado Supongamos que en determinada ocasión podemos clasificar
al reidentificar a participantes anteriores, provocan que al- el comportamiento de cien maestros como «cálido» o «frío»,
gunos de los pares pretest-postest deriven, en realidad, de y el correspondiente a sus alumnos como de «interesados» o
personas distintas. La más elevada correlación resultante X- «no interesados».
postest implica que habrá una menor regresión del informe Al hacerlo así, descubrimos una correlación positiva: los maes-
de X al postest que al pretest y, por tanto, que las diferencias tros cálidos tienen clases interesadas. Cabe plantearse ahora
postest en O serán mayores que las pretest. Esto se traducirá el interrogante de si es la calidez del maestro la que provoca
( si no se ha producido ningún incremento de población) en el interés de la clase, o viceversa. Aunque nuestras expecta-
una seudoganancia para los autoclasificados como expuestos tivas culturales nos predisponen en favor de la primera inter-
y una seudopérdida para los que se clasificaron como no ex- pretación, puede presentarse también un argumento nada
puestos. Este resultado se confundirá por lo común con una desdeñable en favor de la segunda. ( Interviene, sin duda,
confirmación de la hipótesis de que X ha tenido un efecto un efecto de causación recíproca.) Un estudio en panel agre-
[ véase Campbell y Clayton, 1961, para los detalles de esta garía datos pertinentes, .al volver a ponderar las mismas va-
argumentación]. riables en una segunda sesión, con los mismos maestros y
Para evitar esta fuente espuria de mayor correlación, se po- cursos. ( Dos niveles de medición para dos variables generan
dría determinar la exposición a X en forma independiente de la cuatro tipos de reacciones para cada sesión, o sea 4 X 4 po-
entrevista, o en u.na tanda intermedia de entrevistas separa- sibles configuraciones de reacción para ambas acciones, pro-
das. En este último caso, aunque se conservase un recuerdo duciendo el cuadro de dieciséis partes).
sesgado de exposición, ello no produciría artificialmente nin- Con fines simplemente ilustrativos, supongamos ahora el si-
guna correlación X-postest más elevada que la X-pretest. Un guíen te resultado:
diseño de esta índole adoptaría la siguiente forma:
Primera sesión.

Alumnos Maestros
Frío Cálido
Interesados
No interesados

130 131
Segunda sesión. preponderáncia del uno sobre el otro. Estos diagramas repre-
Alumnos Maestros sentan los dos resultados más claros posibles. De producirse
Frío Cálido uno de ellos, el ,examen de los sujetos que se desplazan, po-
sibilitado por la recopilación de datos tipo panel ( imposible
fotcresados 10 40 si en cada caso actuasen distintos alumnos y maestros), pa-
; fo interesados 40 10 rece otorgar gran admisibilidad a una inferencia causal mono-
direccional. Para los que se desplazaron, pueden notarse la
dimensión temporal y el sentido del cambio. De verificarse el
Saltan a la vista tanto la posibilidad de error de la informa- caso indicado en ,primer término, sería poco probable que los
ción cmrelacional ordinaria como el ingenio del análisis de alumnos estuvieran cambiando de maestros, y muy probable
Lazarsfcld, si notamos que entre los desplazamientos_ ql:e ha- que los maestros estuvieran cambiando de alumnos, al menos
brían posibilitado la trasformación se dan los s1gu1cntcs en esos veinte cursos cambiantes.
·Jpuestos polares: Aunque los sociólogos dejan el análisis al nivel dicotómico,
estos requisitos pueden formularse de nuevo en forma más
La del maestro prouoca interés en los alumnos, general, como correlaciones desfasadas en el tiempo, donde el
Maestros «efecto» debería tener una correlación más elevada con
AlumrlM
Frío Cálido
una «causa anterior» que con una «ulterior»; es decir,
rx 1 o 2 > rx 2 o 1 • Tomando el caso en que los maestros son lns
causantes de la conducta de los alumnos, obtenemos:
Interesados 10
Alumnos segunda v.ez lvfaestros primera' vez
No interesados 30 Frío Cálído
Interesados 40
El interés de los alumnos prouoca calidez en el maestro.
No interesados 40 10
Alumnos Aíaestros
Frío ( '.álido Alumncs primera vez 1'Jaestros segunda vez
Frío Cálído
Interesados
Interesados 20 30

No interesados No interesados 30 20

En este caso el ejemplo parece una reformulación trivial de


Hemos considerado aquí solo los cambios que aumentan la los cuadros originales, ya que los maestros no cambiaron en
intercorrelación, soslayando las inevitables osdlacíones, absoluto. Sin embargo, ,es tal vez la mejor forma general de
en este diagrama, a diferencia de Lazarsfeld, no pr~s':n~~- análisis. Nótese que, pese a ser aceptable, tal vez no debería
tamos más que 8 de los 16 casilleros de su cuadro en d1ec1se1s utilizarse el argumento rx1 02 > rx1 01, a causa de las muchas
partes, limitándonos a los cuatro tipos estables (repetidos tan- fuentes no pertinentes de correlación que .se producen entre
to en el diagrama superior como en el inferior) y los cuatro conjuntos de datos tomados en la misma sesión, que inflarían
tipos de desplazamientos que aum_entarían la correla_ción ( dos el valor rx 1 o 1 . Téngase en cuenta que el rx1 02 > rx2 01 su-
arriba y dos abajo). Los cuatro tipos de desplazamientos po- gerido no otorga a ninguna de las correlaciones la menor ven-
drían, por supuesto, producirse a la vez, y cualquier inferen- taja a este respecto,
cia a propósito del sentido la causación se fundaría en una ¿Cuáles son los inconvenientes de este diseño? La aplicación

132 133
de tests, porque su repetición puede traducirse de manera un proceso en el que se intenta una situación de diseño 3 con
bastante general en correlaciones más elevadas entre las va- miras a lograr una ecuación pre-X, empleando un proceso de
riables correlacionadas. El rx1 01 < rx2 02 preliminar puede equiparación en atributos pre-X. El modo de análisis y su nom-
explicarse sobre esta base. No obstante, ello no explicaría bre los introdujo por primera vez Chapín [Chapín y Queen,
con facilidad el hallazgo de rx1 02 > rx2 01, a menos que fue- 1937]. Más adelante han expuesto con amplitud este diseño
se aceptable un efecto de interacción o aplicación de tests Greenwood [1945] y Chapín [1947, 1955]. Aunque estas
peculiar de solo una de las variables. referencias provienen de la sociología y no de la pedagogía, y
La regresión parece constituir un problema menor para este consideramos que el análisis conduce a error, entendemos que
diseño que para el estudio en panel con dos tandas rechazado corresponde exponerlo también en esta obra. Constituye uno
antes, porque tanto X como O se evalúan en ambas tandas, de los esfuerzos más amplios con miras al diseño cuasiexperi-
y por consiguiente la clasificación en tales términos resulta mental. Los ejemplos proceden con frecuencia del ámbito edu-
simétrica. Sin embargo, para el análisis dicotómico tipo La- cacional. La lógica utilizada y los errores en que se incurre,
zarsfeld, la regresión pasa a ser un problema si los marginales son también frecuentes en la investigación pedagógica.
de cnalquiera de las variables presentan una asimetría grave En un típico estudio ex post facto [Chapín, 1955, págs. 99-
(p. ej., divisiones 10-90 en vez de las 50-50 utilizadas en es- 124], la X era la educación recibida en la escuela sécundaria
tos ejemplos). El análisis de correlaciones entre variables con- ( sobre todo en sus últimos años) y las O se relacionaban con
tinuas, empleando todos los casos, no parecería estar en con- el éxito y el ajuste comunitario diez años después, juzgados
flicto con los mecanismos de regresión. La maduración dife- sobre la base de datos obtenidos en entrevistas personales. La
rencial en ambas variables, o los efectos diferenciales de la equiparación se hizo en aquella oportunidad recurriendo a
historia, podrían ser efectos de interacción que pusieran en los archivos escolares ( aunque en estudios análogos, más en-
peligro la validez interna. En cuanto a la externa, son de apli- debles todavía, aquellos hechos pre-X se obtenían en las en-
cación las precauciones habituales, con particular insistencia trevistas post-X). En principio los datos indicaron que quie-
en la interacción selección-X en el sentido de que el efecto se nes completaban la escuela secundaria habían tenido más
ha observado solo a propósito de la subpoblación ique se des- éxito, pero también había influido en ello el mejor puntaje
plaza. obtenido en la escuela primaria, la ocupación de los padres en
Si bien en la mayor parte de las situaciones de enseñanza se niveles superiores, la menor edad, los mejores vecindarios,
dispondría de los diseños 10 o 14 para el tipo de problema etc. Esos antecedentes, pues, podrían haber sido la causa, tan-
planteado en nuestro ejemplo ( y serían preferibles) es probable to de la finalización de la escuela secundaria como del éxito
que existan situaciones en las cuales debería considerarse este posterior.
análisis. El doctor Winfred F. Hill, por ejemplo, ha recomen- ¿Ejerció la escuela algún influjo adicional por encima del me-
dado su aplicación a los datos obtenidos sobre el comporta- jor comienzo ofrecido por esos factores ambientales? La «so-
míen to de padres e hijos en estudios longitudinales. 1 lución» de Chapín a este interrogante fue examinar subcon-
Cuando se generaliza a datos no dicotómicos, el nombn· «Cua- juntos de estudiantes equiparados en todos aquellos factores
dro en dieciséis partes» deja de ser apropiado; recomendamos ambientales, pero con diferencias al concluir la escuela secun-
que se lo denomine «Cori-elación en panel con desfasaje cru- daria. El agregado de cada factor de equiparación redujo a su
zado». vez la discrepancia postest entre los grupos X y no X, pero
una vez realizadas todas las equiparaciones quedó una dife-
rencia significativa. Chapín llegó a la conclusión, si bien cauta,
Análisis «ex post facto» de que la educación había tenido un efecto. Un universo ini-
cial de 2.127 estudiantes se redujo a 1.194 entrevistas com-
En la actualidad, la frase «experimento ex post facto» designa pletadas sobre casos con antecedentes adecuados. El ajuste
los esfuerzos para simular la experimentación por medio de redujo los casos utilizables a 46, es decir, 23 graduados y 23
no graduados, me1103 del 4 % de los entrevistados.
1 Comunicación personal. Chapín sostiene correctamente que 46 casos comparables son

134 135
preferibles a 1.194 no comparables, sobre fundamentos simi- to por medio de X. Este solo hecho aseg~1:ª que la s_ub-
lares a nuestro énfasis relativo a la prioridad de la validez in- equíparacíón sobrepasará el efecto de re~r~~10n por e9u1p~-
terna sobre la externa. Lo lamentable es que sus 46 casos ración. Aun con el predictor pre-X y el anahs1s de covat1anc1a
tampoco son comparables, y lo que es más grave todavía: de O solo es interpretable un efecto significativo de trata-
aun admitiendo su defectuosa argumentación, la reducción era mien;o cuando se han incluido todas las variables equiparadas
innecesaria. que contribuyen en forma conjunta.
Incurrió en una grave subequiparación por dos razones distin-
tas. Su primera fuente de subequiparación que la equipa-
raci6n está sujeta a regresión diferencial, la que en este caso
produciría por cierto una diferencia final en el sentido obte-
nido ( ele fo manera inclicacla por R. L. Thorndike, 1942 y
analizada a propósito de la equiparación en el diseño 10). El
sentido del seudoefecto de la regresión relativa a medias gru-
pales después ele la equiparación es en este caso seguro, pues
las diferencias en los factores de equiparación entre los que
lograron éxito frente a los que no lo tuvieron tienen el mis-
mo sentido para cada factor que las diferencias entre los que
completaron la escuela secundaria y los que la abandonaron
antes de finalizar sus estudios.
Cada determinante de exposición a X es, de manera similar
y aun sin X, un determinante de O. Todas las variables
equiparadas correlacionan con X y O en el mismo sentido.
Aunque bien podría no ocurrir así en todas las variables de to-
dos los estudios ex post facto, sí acaece, si no en todos, en la
mayor parte de los ejemplos publicados. Este ,error y la reduc-
ción en el número de casos pueden evitarse por medio de la es-
rnclística moderna, que elude el error ele equiparación en el
diseño 10.
Las variables de equiparación podrían ser utilizadas en su tota-
lidad como covaríables en un análisis de covaríancia con cova-
riables múltiples. Estimamos con toda seriedad que ese aná-
lisis eliminaría los efectos aparentemente significativos en los
estudios específicos presentados por Chapín. (Véase, sin em-
bargo, Lord [ 1960], por su crítica del análisis de covariancia
para problemas de esta índole.) Pero hay otra inevitable
fuente de subequíparación en la configuración de Chapín.
Greenwood [ 1945] la designa con el nombre de autosdec-
ción de exposición o no exposición. La exposición es conse-
cuencia lógica de muchos antecedentes. En el caso del abandono
de la escuela secundaria antes ele finalizarla, ,;;abemos que son
innumerables los determinantes posibles, aden~ás de aquellos
sobre los cuales se hizo la equiparación. Podemos suponer,
con gran seguridad, que casi todos ellos tendrán un efecto
similar sobre éxitos ulteriores, independientemente de su ef ec-

136 137
7. Comentarios finales bre todo para ilustrar los factores de validez que requieren
control. Tres de ellos se consideraron diseños experiment~les
propiamente dichos. Y de diez se ha dicho que ~o~ cuas1ex•
perimentos pues carecen de un control perfecto_, s1 bien :nere-
cen que se los adopte cuando no haya nada meior. Para mter-
pretar los resultados de esos experimentos, es de particular
importancia la lista de verificación de factores de validez. En
general hemos llamado la atención sobre la posibilidad de
utilizar' creatívamente las características peculiares de cual-
Esta obra es ya en sí una exposición condensada. Un resumen quier situación concreta de investigación al diseñar pruebas
de ella puede inducir a engaño. En este sentido, parece im- específicas de las hipótesis causales.
prescindible una advertencia final a propósito de la tendencia
a utilizar con ese fin los cuadros 1, 2 y 3, de aparente pero
falsa conveniencia. Esos cuadros, en calidad de bosquejo re-
currente, han contribuido en parte a ordenar la obra hacién-
dola menos reiterativa. Pero la colocación de signos positivos,
negativos e interrogativos ha sido siempre equívoca y, por lo
común, constituye un mal resumen del correspondiente análi-
sis. Es probable que en cualquier ejecución particular de un
diseño, la fila de comprobación resulte distinta de fa que apa-
rece en el correspondiente cuadro.
Por ejemplo, la solución de empate del diseño 6 a la cual
aludimos al pasar en el diseño cuasiexperimental 16 tiene, se-
gún lo allí expuesto, dos signos interrogativos y uno negativo
que no aparecen en el cuadro 1 en la fila del diseño 6. La me-
jor forma de utilizar los cuadros es hacerlo a manera de otros
tantos bosquejos de un cuidadoso estudio de los detalles par-
ticulares de un experimento durante la etapa de su planifíca-
ción. Del mismo modo, esta obra no pretende sustituir con
el dogma de los 13 diseños aceptables otro dogma anterior
del diseño o par de diseños aceptables. Más bien habría que
estimular una actitud abierta hacia la indagación de los nue-
vos mecanismos de obtención de datos, y un nuevo análisis
acerca de algunas de las imperfecciones que acompañan a la
aplicación rutinaria de los tradicionales.
Por último, hemos visto en este trabajo distintas alternativas
sobre los dispositiv'Js o diseños experimentales, con particular
referencia a los p;oblemas de control de variables externas y
amenazas a la validez. Hay que distinguir entre validez inter-
na y externa, o posibilidad de generalizar. Se han empleado
ocho clases de amenazas a la validez interna y cuatro a la ex-
terna, para evaluar dieciséis diseños experimentales y unas
cuantas variaciones sobre ellos. Tres de esos diseños se han
clasificado como preexperimentales y se los ha empleado so-

138 139
Referencias bibliográficas Brownlee, K. A.
1960. Statistical theory and methodology in scu'11c,· ,11!,/ , ,,
gineering, Nueva York: Wiley.
Brunswik, E.
1956. Perception and the representative design of ¡,q,,·/,,,/"
gical experiments, Berkeley: University of California l'I<".·.
2a. ecl.
Campbell, D. T.
Allport, F. H. 1957. «Factors relevant to the validity of experimenls 111 ,.,
1920. «The influence of the group upon assoc1at10n and cial scttings», Psychol. Bull., vol. 54, págs. 297-312.
thought», J. Exp. Psychol., vol. 3, págs. 159-82. 1959. «Methodological suggestions from a comparativc ¡,,v
Anastasi, A. chology of knowledge processes», Inquiry, vol. 2, págs. 1').'
1958. Dífferential psycholog,y, Nueva York: Macmillan, 3a. 82.
ed. ( Psicología diferencial, Madrid: Aguilar, 1964.) 1960. «Recommendations for APA test standards regardi111'.
Anderson, N. H. construct, trait, or discriminant validity», Amer. Psycholo¡:irr
1959. «Test of a model for opinion change», J. Abnorm. Soc. vol. 15, págs. 546-53.
Psychol., vol. 59, págs. 371-81. 1963. «From description to experimentation: Interprct i11g
trends as cuasi experiments», en C. W. Harris, ed., Problcm1
Batch, A. M., Trumbo, D. y Nangle, J. in measuring change, Madison: University of Wisconsin Pres,.,
1957. «Social setting and conformity to a legal requirement,> págs. 212-42. 1
J. Abnorm. Soc. Psychol., vol. 55, págs. 396-98. ' 196 7. «Administrative experimentation, institutional record,.
Blalock, H. M. and nonreactive measures», en J. C. Stanley, ed., Improvi11¡'.
1964. Causal inferences in nonexperimental research, Chapel experimental design and statistical analysis, Chicago: R:111,I
Hill: University of North Carolina Press. McNally.
«Quasi-experimental designs for use in natural social sL·t
Boring, E. G.
tings», en D. T. Campbell, Experimenting, validating, k11011•
1954. «The nature and the history of experimental control ►>, ing: Problems of method in the social sciences, Nueva York·
Amer. J. Psychol., vol. 67, págs. 573-89. McGraw-Hill, en preparación.
Box, G. ,E. ,P.
196 7. «Bayesian approaches to sorne bothersome problems in Campbell, D. T. y Clayton, K. N.
data analysis», en J. C. Stanley, ed., Improving experimental 1961. «Avoiding regression effects in panel studies of con1
design and statistical analysis, Chicago: Rand McNally. munication impact», Stud. Pub. Commun., n? 3, págs. 'J')
118.
Box, G. E. P. y Tiao, G. C.
1965. «A change in level of a non-stationary time series ►>, Campbell, D. T. y Fiske, D. W.
Biometrika, vol. 52, págs. 181-92. 1959. «Convergent and discriminant validation by the multi
trait-multimethod matrix», Psychol. Bull., vol. 56, págs. 81
Brim, O. G. 105.
195 8. «Family structure and sex role learning by children:
A further analysis of Helen Koch's data», Sociometry, vol. Campbell, D. T. y McCormack, T. H.
21, págs. 1-16. 1957. «Military experience and attitudes toward authority»,
Amer. J. Saciol., vol. 62, págs. 482-90.
Brolyer, C. R., Thorndike, E. L. y Woodyard, E.
1927. «A second study of mental discipline in high school stu- Cane, V. R. y Heim, A. W.
dies», J. Educ. Psychol., vol. 18, págs. 377-404. 1950. «The effects of repeated testing: III. Further expcn

140 141
ments and general conclusions», Quart. J. Exp. Psychol., vol. cial experiment, Minneapolis: University of Mínnesota 1'1..-,,•,
2, págs. 182-95. Du.ncan, C. P., O'Bríen, R. B., Murray, D. C., Davis, 1. y
Cantor, G. N. Gílliland, A. R.
1956. «A note on a rnethodologícal error cornmonly com- 1957. <<Sorne information about a test of psychological 1111•,
mitted in medical and psychologícal research», Amer. J. conceptions», J. Gen. Psychol., vol. 56, págs. 257-60.
·Ment. Defic., vol. 61, págs. 17-18. Ebbinghaus, H.
Cochran, \YJ. G. y Cox, G. M. 1913. J\1emory, Nueva York: Columbia University, Tcad1n:,
1957. Experimental designs, Nueva York: \Xliley, 2a. ed. College.
Collier, R. M. Edwards, A. L.
1944. «The effect of propaganda upon attitude following a 1960. Experimental design in pyschological research, Nuev,1
critica] exarnination of the propaganda itself», J. Soc. Psychol., York, Rinehart, ed. rev.
vol. 20, págs. 3-17. Farmcr, E., Brooks, R. C. y Chambers, E. G.
Collier, R. O., h. 1923. A comparison of different shift systems in the !1,lan
1960. «Three types of randornization in a two-factor experi- trade. Rep. 24, Medical Research Council, Industrial Fatigw·
ment», Minneapolis: edición del autor, 1960 (fotocopia). Research Board, Londres: His Majesty's Stationery Office.
Cornfield, J. y Tukey, J. \YJ. Feldt, L. S.
1956. «Average values of mean squares in factorials», Ann. 1958. «A comparison of the precision of three experimental
Math. Statist., vol. 27, págs. 907-49. designs employing a concomitant variable», Psychometrika,
Cox, D. R. vol. 23, págs. 335-53.
1951. «Sorne systematíc experimental designs», Biometrika, Ferguson, G. A.
vol. 38, págs. 312-23. 1959. Statistícal analysis in psychology'and education, Nueva
1957. «The use of a concornítant variable in selecting an ex- York: McGraw-HilL
perimental design», Bíometrika, vol. 44, págs. 150-58.
1958. Planning of experiments, Nueva York: \YJiley. Fisher, R. A. •
1925. Statistical methods for research workers, Londres: Oli-
Crook, M. N. ver & Boyd, la. ed. ( T ablc1s estadísticas para investigadores
1937. «The constancy of neurotícism seores and self-judg- científicos, Madrid: Aguilar, 2a. ed., 1954.)
ments of constancy», J. Psychol., vol. 4, págs. 27-34. 1926. «The arrangement of field experiments», J. Min. Agrí-
Chapín, F. S. culture, vol. 33, págs. 503-13; reimpreso en Contributions to
1947. Experimental designs in sociological research, Nueva mathematical statistics, Nueva York: \YJiley, 1950.
York: Harper, 1947. ed. rev., 1955. 1935. The design of experiments, Londres: Oliver & Boyd,
Chapín, F. S. y Queen, S. A. la. ed.
1937. Research memorandum on social work in the depres- Glass, G. V.
sion, Nueva York: boletín n'? 39, del Social Science Research 1965. «Evaluating testing, maturation, and treatment effects
Council. in a pretest posttest quasi-experimental desígn», Amer. Educ.
Chernoff, H. y Mases, L. E. Res. ]., vol. 2, págs., 83-7.
1959. Elementary decisíon theory, Nueva York: \YJiley. (Teo- Glickman, S. R
ría y cálculo elemental de las decisiones, Méxíco: CECSA, 1961. <<Perseverative neu.ral processes and consolidation of
1967.) the memory trace», Psychol. Bull., vol. 58, págs. 218-33.
Deutsch, M. y Collins, M. E. Glock, C. Y.
1951. Interracial housing: A psychological evaluation of a so .. 1955. «Sorne applications of the panel method to the stu<ly

142 143
of social change», en P. F. Lazarsfeld y M. Rosenberg, eds.,
The language of social research, Glencoe Ill.: Free Press, Jost, A.
págs. 242-49. 1897. «Die Assoziationsfestigkeit in ihrer Abhangigkeit von
1958. «The effects of re-interviewing in panel research», co- der Verteilung der Wiederholungen», Z. Psychol. Physiol. Sin-
pia litográfica de un capítulo de P. F. Lazarsfeld, ed., The nesorgane, vol. 14, págs. 436-72.
study of short run social change, en preparación. Kaiser, H. F.
Good, C. V. y Scates, D. E. 1960. «Directional statistical decisions», Psychol. Rev., vol.
1954. Methods of research, Nueva York: Appleton-Century- 67, págs. 160-67.
Crofts. Katz, D., Maccoby, N. y Morse, N. C.
Grant, D. A. 1951. Productivity, supervision, and morale in an office si-
1956. «Analysis-of-variance tests in the analysis an<l compa- tuation, Ann Arbor: University of Michigan, Survey Research
rison of curves», Psychol. Bull., vol. 53, págs. 141-54. Center.
Green, B. F. y Tukey, J. W. Kcmpthorne, O.
1960. «Complex analyses of variance: General problems», 1952. The desing and analysis of experiments, Nueva York:
Psychometrika, vol. 25, págs. 127-52. Wiley.
Greenwood, E. 1955. «The randomization theory of statistical inference»,
1945. Experimental sociology: A study zn method, Nueva J. Amer. Statist. Ass., vol. 50, págs. 946-67; 1956, vol. 51,
York: King's Crown Press. pág. 651.
1961. «The design and analysis of experiments, with sorne
Guetzkow, H., Kelly, E. L. y McKeachie, W. J. reference to educational research», en R. O. Collier y S. M.
1954. «An experimental comparison of recitation, discussion, Elam, eds., Research design and analysis: The second annual
and tutorial methods in college teaching>>, J. Educ. Psychol., Phi Delta Kappa symposium on educational research, Bloom-
vol. 45, págs. 193-207. ington, Ind.: Phi Delta Kappa, págs. 97-133.
Hammond, K. R.
1954. «Representative vs. systematic design in clinical psy- Kendall, M. G. y Buckland, W. R.
1957. A dictionary of statistical terms, Londres: Oliver &
chology», Psychol. Bull., vol. 51, págs. 150c59.
Boyd.
Hanson, N. R.
1958. Patterns of discovery, Cambridge, Inglaterra: Univer- Kennedy, J. L. y Uphoff, H. F.
sity Press. 19 39. «Experiments on the nature of extra-sensory percep-
tion. III. The recording error criticisms of extrachance seo-
Hovland, C. I., Janis, I. L. y Kelley, H. H. res», J. Parapsychol., vol. 3, págs. 226-45.
1953. Communicatirm and persuasion, New Haven, Cono.:
Y ale University ,Press. Kerr, W. A.
194 5. «Experiments on the effect of mu sic on factory produc-
Hovland, C. I., Lumsdaine, A. A. y Sheffield, F. D. tion», Appl. Psychol. Monogr., ne:> 5.
19~9. Experiments on mass communication, Princeton N. J.:
Prmceton University Press. Lana, R. E.
1959a «Pretest-treatment interaction effects in attitudinal stu-
Johnson, P. O. dies», Psychol. Bu!!., vol. 56, págs. 293-300.
1949. Statistical methods in research, Nueva York: Prentice- l 959b. «A further investigation of the pretest-treatment in-
Hall. teraction effect, J. Appl. Psychol., vol. 43, págs. 421-22.
Johnson, P. O. y Jackson, R. W. B.
Lana, R. E. y King, D. J.
1959. Modern statistical methods: Descriptive and inductive 1960. Learning factors as determiners of pretest sensitiza-
Chicago: Rand McNally. '
tion», J. Appl. Psychol., vol. 44, págs. 189-91.

144
145
Lindquist, E. F. Mood, A. F.
1940. Statístical analysis in educatíonal research, Boston: 1950. Introduction to the theory of statistics, Nueva York:
Houghton Mifflin. McGraw-Hill (Introduccíón a la teoría de la estadístíca, Ma-
1953. Design and analysis of experiments in psycholagy and drid: Aguilar, 2a. ed., 1969.)
education, Boston: Houghton Mifflin. Moore, H. T.
Lipset, S. M., Lazarsfeld, P. F., Barton, A. H. y Linz, J. 1921. «The comparative influence of majority and expert opi-
1954. <<The psychology of voting: An analysis of política] níon», Amer. J. Psychol., vol. 32, págs. 16-20.
behavior», en G. Lindzey, ed., Handbook of social psychology, Morse, N. C. y Reimer, E.
Cambridge, Mass.: Addison-Wesley, págs. 1124-75. (Manual 1956. «The experimental change of a major organizationaI
de psicología social, Buenos Aires: Paidós, en preparación.) variable», J. Abnorm. Soc. Psychol., vol. 52, págs. 120-29.
Lord, F. M. Myers, J. L.
1956. «The measurement 'OÍ growth», Educ. Psychol. 1959. «On the interaction of two scaled variables», Psychol.
Measmt., vol. 16, p11gs. 421-37. Bull., vol. 56, págs. 384-91.
1958. <<Furthcr problems in the mcasurement of growth»,
Educ. Psychol. Measmt., vol. 18, págs. 437-51. Newcomb, T. M.
1960. «Large-sample covariance analysis when the control 1943. Personality and social change, Nueva York: Dryden.
variable is fallible», J. Amer. Statist. Ass., vol. 55, págs. 307- Neyman, J.
21. 1960. «Indeterminism in science and new demands on statis-
Lubin, A. tidans», J. Amer. Statist. Ass., vol. 55, págs. 625-39.
1961. «The interpretation of significant interaction», Educ. Nunnally, J.
Psychol. Measmt., vol. 21, págs. 807-17. 1960. «The place of statistics in psychology», Educ. Psychol.
Maxwell, A. E. Measmt., vol. 20, págs. 641-50.
1958. Experimtmtal design in psychology and the medica! Page, E. B.,
sciences, Londres: Methuen. 1958. «Teacher comments and student performance: A se-
McCall, W. A. venty-four classroom experiment in school motivation», J.
1923. How to experiment in education, Nueva York: Mac- Educ. Psychol., vol. 49, págs. 173-81.
millan.
Pearson, H. C.
McNemar, Q. 1912. «Experimental studies in the teaching of spelling»,
1940. «A critica! examination of the University of Iowa stu- Teachers Coll. Rec., vol. 13, págs. 37-66.
dies of environmental influences upon the l. Q.», Psychol.
Bull., vol. 37, págs. 63-92. Pelz, D. C. y Andrews, F. M.
1958. «On growth measurement», Educ. Psychol. Measmt., 1964. «Detecting causal prioritíes in panel study data»,
vol. 18, págs. 47-55. Amer. Sodol. Rev., vol. 29, págs. 836-48.
1962. Psychological statistics, Nueva York: Wiley, 3a. ed. Peters, C. C. y Van Voorhís, W. R.
Meehl, P. E. 1940. Statistical procedures and theír mathematical bases,
195 4. Clinical versus statt'stical predictwn, Minneapolis: Uni- Nueva York: McGraw-Hill.
versi ty of Minnesota Press. Piers, E. V.
Monroe, W. S. 1954. ,<Effects of instruction on teacher attitudes: Exten-
1938. «Genera] methods: Classroom experimentation», en ded control-group design», tesis inédita de doctorado, George
G. M. Whipple, ed., Yearb. Nat. Soc. Stud. Educ., vol. 37, Peabody Coll.
part. II, págs. 319-27. 1955. «Abstract», Bull. Maritime Psychol. Ass., págs. 53-56.

146 147
Popper, K. R. 1957. <<Reference groups, membership groups, and attit11d,·
1959. The logic of scientific discovery, Nueva York: Basic change», J. Abnorm. Soc. Psychol., vol. 55, págs. 360-64.
Books. (La lógica de la investigación científica, Madrid: Tec- Simon, H. A.
nos, 1965.) 1957. Models of man, Nueva York: Wiley.
Rankin, R. E. y Campbell, D. T. Smith, H. L. y Hyman, H.
1955. «Galvanic skin response to negro and white experi- 1950. «The biasing effect of interviewer expectations on sur-
menters», J. Abnorm. Soc. Psychol., vol. 51, págs. 30-3. vey results», Publ. Opin. Quart., vol. 14, págs. 491-506.
Reed, J. C. Sobo!, M. G.
19 5 6. « Sorne eff ects of short term training in reading un- 1959. «Panel mortalitv and panel bias», J. Amer. Statist.
der conditions of controlled motivation», J. Educ. Psychol., Ass., vol. 54, págs. 52:68.
vol. 47, págs. 257-64.
Solomon, R. L.
Rogers, C. R. y Dymond, R. F. 1949. «An extension of control group design», Psychol.
1954. Psychotherapy and p¡:monality change, Chicago: Uni- Bull., vol. 46, págs. 137-50.
versity of Chicago Press.
Sorokin, P. A.
Rosenthal, R. 1930. «An experimental study of efficiency of work unde_r
1959. «Research on experimenter bias>>, trabajo leído en la various specified conditions», Amer. J. Socíol., vol. 35, págs.
American Psychological Association, Cincinnatí. 765-82.
Roy, S. N. y Gnanadesik:m, R. Stanley, J. C.
1959. «Sorne contributions to ANO VA in one or more di- 1955. «Statistícal analysis of seores from counterbalanced
mensions: I and 11», Ann. Math. Statist., vol. 30, págs. 304- tests», J. Exp. Educ., vol. 23, págs. 187-207.
17, 318A0. 1956. «Fixed random, and mixed models in the analysís of
Rozeboom, \Yl. \Yl. variance as special cases of finite model 111», Psychol. Rep.,
1960. «The fallacy of the nullhypothesis significance test» vol. 2, pág. 369.
Ps•/chol. Bull., vol. 57, págs. 416-28. 19 57a. «Controlled experimentation in the dassroom», J.
Exp. Educ., vol. 25, págs. 195-201.
Rulon, P. J. 1957b. «Research methods: Experimental design», Rev.
1941. «Problems of regression», Harvard Educ. Rev., vol. Educ. Res., vol. 27, págs. 449-59.
11, págs. 213-23. 1960. «Interactíons of organisms with experimental varia-
Sanford, F. H. y Hemphill, J. K. bles as a key to the integration of organismic and variable-
1952. An evaluation of a brief course in psychology at the manipulating research», en E. M. Huddleston, ed., Yearb.
U. S. Naval Academy», Educ. Psychol. Measmt., vol. 12, Nat. Counc. Measmt. used in Educ., págs. 7-13.
págs. 194-216. 1961a. «Analysis of a double nested design», Educ. Psychol.
Measmt., vol. 21, págs. 831-37.
Scheffé, H. 196 lb. <<Studying status vs. manipulating variables», en ~-
1956. «Alternative models for the analysis of variance», Ann. 0. Collíer y S. M. Elam, eds., Research design and analysts:
Aiath. Statist., vol. 27, págs. 251-71. The second Phi Delta Kappa symposium on educational re-
Sel1tiz, C., Jahoda, M., Deutsch, M. y Cook, S. W. search. Bloomington, Ind.: Phi Delta Kappa, págs. 173-208.
1959. Research methods in social relations, Nueva York: 1961c. «Analysis of unreplicated threeway classifications, with
Holt-Dryden, ed. rev. (Métodos de investigación en las re- applications to rater bias and trait independence», Psycho-
ltlcíones sociales, Madrid: Rialp, 2a. ed., 1965.) metrika, vol. 26, págs. 205-20.
1962. «Analysis-of-variance principies applied to the grading
Siegel, A. E. y Siegel, S. of essay tests», J. Exp. Educ., vol. 30, págs. 279-83.

148 149
1965. «Quasi-experimentation», Sch. Rev., vol. 73, págs. Thorndike, E. L. y Woodworth, R. S.
197-205. 1901. «The influence of improvement in one mental function
I 966a. «A common class of pseudo-experiments», Amer. upon the efficiency of other functions», Psychol. Rev., vol.
Educ. Res. ]., vol. 3, págs. 79-87. 8, págs. 247-61, 384-95, 553-64.
1966b. «The influence of Fischer's The design o/ experi- Thorndike, R. L.
ments on educational research thirty years later», Amer. Educ. 1942. «Regression fallacies in the matched groups experi-
Res. ]., vol. 3, págs. 223-29. ment>>, Psychometrika, vol. 7, págs. 85-102.
1966c. «Rice as a pioneer educational researcher», J. Educ.
Measmt., vol. 3, págs. 135-39. Underwood, B. J.
1949. Experimental psychology, Nueva York: Appleton-Cen-
Stanley, J. C. y Beeman, E. Y. tury-Crofts.
1956. «Interaction of major field of study with kind of test», 1954. «An analysis of the methodology used to investigate
Psycbol. Rep., vol. 2, págs. 333-36. thinking behavior», trabajo leído en la New York University
1958. «Restricted generalization, bias, and loss of power that Conference on Human Problem Solving, abril de 1954. (Véa-
may rcsult from matching groups», Psychol. Newsltr., vol. se también C. I. Hovland y H. H. Kendler, «The New
9, págs. 88-102. York University Conference on Human Problem Solving»,
Stanley, J. C. y Wiley, D. E. Amer. Psychologist, vol. 10, págs. 64-68.)
1962. Development and analysis of experimental designs for 1957a. «Interference and forgetting», Psychol. Rev., vol. 64,
ratings, Madison, ;wis.: edición de los autores. págs. 49-60.
1957 b. «Psychological research, Nueva York: Appleton-Cen-
Stanton, F. y Baker, K. H. tury-Crofts.
1942. «Interviewer-bias and the recall of incompletely lear-
ned materíals», Sociometry, vol. 5, págs. 123-34. Underwood, B. J. y Richardson, J.
Star, S. A. y Hughes, H. M. 1958. <<Studies of distributed practice. XVIII. The influen-
1950. «Report on an educational campaign: The Cincinnati ce of meaningfulness and intralist similarity of serial nonsen-
plan for the United Natíons», Amer. J. Social., vol. 55, págs. se lists», J. Exp. Psychol., vol. 56, págs. 213-19.
389-400. 1947. U. S. War Departrnent, Informatíon and Education
Division, «Opinions about Negro infantry platoons in white
Stockford, L. y Bissell, H. W. companies of seven divisions», en T. M. Newcomb y E. L.
1949. «Factor involved in establishing a rnerit-rating scale», Hartley, eds., Readings in social psychology, Nueva York:
Personnel, vol. 26, págs. 94-116. Holt, págs. 542-46. (Manual de psicología social, Buenos Ai-
Stouffer, S. A., ed. res: Eudeba, 2 vols., 1964.)
1949. The American soldier, Princeton, N. J.: Princeton Uni- Watson, R. I.
Press, vols. I y II. 1959. Psychology of the child, Nueva York: Wiley.
1950. <<Sorne observations on study dcsignt>, Amer. J. So-
Webb, E. J., Campbell, D. T., Schwartz, R. D. y Sechrest, L.
cial., vol. págs. 355-61. 1966. «Unobtrusive measures: Nonreactive research in the
Thistlethwaite, D. L. y Campbell, D. T. social sciences», Chicago: Rand McNally.
1960. «Regression-discontinuity analysis: An alternative to Wilk, M. B. y Kempthorne, O.
,he ex post facto experiment», J. Educ. Psychol., vol. 51, 1955. «Fixed, mixed, and random models,>, J. Amer. Statíst.
págs. 309-17. Ass., vol. 50, págs. 1144-67.
Thorndike, E. L., McCall, \Y/. A. y Chapman, J. C. 1956a. «Corrigenda», J. Amer. Statíst. Ass., vol. 51, pág.
1916. «Ventilation in relation to mental work», Teach. Col!. 652.
Contr. Educ., n? 78. 1956b. «Sorne aspects of the analysis of factorial experiments

L50 151
in a completely randomized desing», Ann, Math. Statist., vol. Indice onomástico
27, págs. 950-85.
1957. «Non-addítívities in a Latín square desigm,, J. Amer.
Statist. Ass., vol. 52, págs. 218-36.
Windle, C.
1954. «Test-retest effect on personality questionnáires»,
Educ. Psychol. Measmt., vol. 14, págs. 617-33.
Winer, B. J. Allport, F. H., 86-87, 90, Cornfield, J., 64, 142
1962. Statistical principies in experimental design, Nueva 140 Cox, D. R., 9, 36, 50, 89-90,
York: McGraw-Hill. Anastasi, A., 23, 140 99, 142
Wold, H. Anderson, N. H., 41, 140 Cox, G. M., 99, 142
1956. «Causal inference from observational data. A review Andrews, F. M., 147 Crook, N. V., 21, 142
of ends and means>,, J. Royal Statist. Soc., sec. A, vol. 119, Chambers, E. G., 77, 143
págs. 28-61. Baker, K. H., 34, 105, 150
Barch, A. M., 126, 140 Chapín, F. S., 135-36, 142
Wyatt, S., Fraser, J. A. y Stock, F. G. L. Barton, A. H., 131, 146 Chapman, J. C., 11, 150
1926. «Fan ventilation in a humid weaving shed», informe Beeman, E. Y., '69, 96, 150 Chernoff, H., 16, 142
n'! 37 del Medical Research Council, Industrial Fatigue Re- Bíssell, H. W., 130, 150
search Ifoard, Londres: His Majesty's Stationery Office. Blalock, H. M., 140 Davís, L., 143
Boring, E. G., 19, 32, 140 Deutsch, M., 103, 127-28,
Zeisel, H. 142, 148
1947. Say it wíth fif!.ures, Nueva York: Harper. Box, G. E. P., 140
Brim, O. G., 126, 140 Duncan, C. P., 41, 106, 114,
Brolyer, C. R., 98, 140 143
Brooks, R. C., 77, 143 Dymond, R., 38, 148
Brownlee, K. A., 9, 64, 141 Ebbinghaus, H., 88, 143
Brunswik, E., 67, 87, 141 Edwards, A. L., 9, 58, 143
Buckland, W. R., 11, 145 Elam, S. M., 145, 149
Euler, L., 11
Campbell, D. T., 7, 14, 16,
23-24, 41, 69-70, 72, 111, Farmer, E., 77, 143
114, 118, 129-30, 141, Feldt, L. S., 36, 50, 143
148, 150-51 Ferguson, G. A., 9, 58, 64,
Cane, V. R., 23, 141 143
Cantor, G. N., 50, 142 Fisher, R. A., 9-11, 14, 31,
Clayton, K. N., 9, 129-30, 50, 54, 57, 143.
141 Físke, D. W., 69, 141
Cochran, W. G., 99, 142 Fraser, J. A., 87, 152
Collier, R. M., 21, 142
Collíer, R. O., h., 90, 142, Gage, N. L., 7
145, 149 Gilliland, A. R., 143
Collins, M. E., 12728, 142 Glass, G. V., 143
Cook, S. W., 103, 148 Glickman, S. E., 75, 143

153
152
Clock, C. Y., 41, 129-30, Lana, R. E., 41, 145 Pearson, H. C., 32, 147 Stanton, F., 34, 105, 150
143 Lazarsfeld, P. F., 131-32, Pelz, D. C., 147 Star, S. A., 103-04, 106,150
Gnanadesikan, R., 14, 148 134, 144, 146 Peters, C. C., 36, 96, 147 Stock, F. G. L., 87, 152
Good, C. V., 12, 144 Líndquist, E. F., 9, 36, 48, Píers, E., 41, 147 Stockford, L., 130, 150
Grant, D. A., 64, 144 50, 58, 97, 100, 146 Popper, K. R., 73, 148 Stouffer, S. A., 19, 128, 150
Green, B. F., 49, 62, 144 Lindzey, G., 146
Greenwood, E., 135-36, 144 Linz, J., 131, 146 Queen, S. A., 135, 142 Thistlethwaite, D. L., 118,
Guetzkow, H., 67, 69, 144 Lipset, S. M., 131, 146 150
Lord, F., 28, 97, 136, 146 Rankin, R. E., 23, !148 Thorndikc, E. L., 12, 98,
Hammond, K. R., 67, 144 Lubin, A., 61, 103, 146 Rce<l, J. C., 38, 148 140, 150-51
Hanson, N. R., 73, 144 Lurnsdaine, A. A., 41, 65, Reimer, E., 124, 147 Thorndike, R. L., 28, 96,
Harris, C. W., 141 114, 144 Richardson, J., 93, 151 136, 151
Hartley, E. L., 151. Rogers, C. R., 38, 148 Tiao, G. C., 140
Hcim, A. W., 23, 141 Maccoby, N., 124, 145 Rosenberg, M., 144 Trumbo, D., 126, 140
IIemphill, J. K., 95, 148 Maxwell, A. E., 89, 99, Rosenblatt, P. C., 9 Tukey, J. W., 49, 62, 64,
Hill, W. F., 134 146 Rosenthal, R., 34, 148 142, 144
Hovland, C. L, 41, 65, 114, McCall, W. A., 10-11, 14, Roy, S. N., 14, 148
144, 151 32, 36, 99, 146, 1150 Rozeboom, W. W., 49, 148 Underwood, B. J., 13, 56,
Huddleston, E. M., 149 McCormack, T. H., 111, Rulon, P. J., 28, 96, 148 65,67, 75, 77, 88,93,99,
Hughes, H. M., 103-04, 106, 114, 141 151
150 McKeachie, W. J., 67, 69, Sanford, F. H., 95, 148 Uphoff, H. F., 34, 145
Hume, D., 39 144 Scates, D. E., 12, 144
Hyman, H., 1.05, 149 McNemar, Q., 9, 27-28, 146 Scheffé, H., 64, 148 Van Voorhis, W. R., 36, 96,
Meehl, P. H., 120, 146 Schwartz, R. D., 151 147
Jackson, R. W. B., 9, 58, 96, Mill, J. S., 40 Sechrest, L., 151
144 Monroe, W. S., 12, 146 Selltiz, C., 103, 148 Watson, R. I., 75, 151
Jahoda, M., 103, 148 Mood, A. F., 8.5, 147 Sheffield, F. D., 41, 65, 114, Webb, E. J., 151
Janis, L L., 65, 144 Moore, H. T., 91, 147 144 Whipple, G. M., 146
Jobnson, P. O., 9, 58, 96, Morse, N. C., 124, 145, 147 Siegel, A., 48, 148 Wiley, D. E., i14, 150
144 Moses, L. H., 16, 142 Siegel, S., 48, 148 Wilk, M. B., 52-53, 58, 64,
Jost, A., 91-93, 145 Müller, G. E., 91 Simon, H. A., 126, 149 103, 151
Murray, D. C., 143 Smith, H. L., 105, 149 Windle, C., 21, 23, 50, 152
Kaiser, H. F., 49, 14.5 Myers, J. L., 64, 147 Sobo!, M. G., 41, 149 Winer, B. J., 9, 64, 152
D., 124, 145 Solomon, R. L., 32-33, 41, Wold, H., 126, 152
Kelley, H. H., 65, 144 Nangle, J., 126, 140 46, 53-54, 74, 114, 149 Woodworth, R. S., 98, 151
Kelly, E. L., 67, 69, 144 Newcomb, T. M., 128, 147, Sorokin, P., 86-87, 90, 149 Woodyard, E., 98, 140
Kempthorne, O., 52-53, 58, 151 Stanley, J. C., 7, 9, 14, 44, Wyatt, S., 87, 152
64, 88, 90, 99, 103, 145, Neyman, J., 45, 96, 147 62, 64, 69, 96, 103, 140-
151 Nunnally, J., 49, 147 41, 149-50 Zeisel, H., 41, 152
Kendall, M. G., 11, 145
Kendler, H. H., 151 O'Brien, R. B., 143
Kennedy, J. L., 34, 145
Kerr, W. A., 87-88, 145 Page, E. B., 47, 51, 147
King, D. J., 41, 145 Pavlov, l., 79

154 155
Indice general

7 Nota preliminar 64 Modelos finitos, aleatorios, fijos y mixtos


65 Otras dimensiones de extensión
9 l. Introducción 65 Aplicación de tests en busca de efectos mediatos
66 Generalización a otras X: Variabilidad en la ejecu-
ción de X
10 2. El problema y sus antecedentes
68 Generalización a otras X: Refinamiento secuencial de
X y grupos de control noveles
1O McCall como modelo 68 Generalización a otras 'O
11 La desilusión provocada por los experimentos llevados
a cabo en el campo de la educación
14 Concepción evolutiva sobre la ciencia y la acumulación
70 5. Diseños cuasiexperimentales
de conocimientos
16 Factores que atentan contra la validez tanto interna 71 Algunos comentarios preliminares sobre la teoría de
como externa la experimentación
76 7. Experimento de series cronológicas
84 Tests de significación para el diseño de serie cronoló-
19 3. Tres diseños preexperimentales
gica
86 8. Diseño de muestras cronológicas equivalentes
19 l. Estudio de. caso con una sola medición 89 Tests de significación para el diseño 8
20 2. Diseño pretesl-postest de un mio grupo 90 9. Diseño de materiales equivalentes
29 3. Comparación con un grupo estático 93 Estadísticas del diseño 9
93 10. Diseño de grupo de control no equivalente
31 4. Tres diseños experimentales propiamente 99 11. Diseños compensados
dichos 103 12. Diseño de muestra separada pretest-postest
107 13. Diseño de muestra separada pretest-postest con
32 4. Diseño de grupo de control pretest-postest grupo de control
32 Controles de validez interna 108 14. Diseño de series cronológicas múltiples
38 Factores que atentan contra la validez externa 110 15. Diseño de ciclo institucional recurrente: un di-
49 Tests de significación para el diseño 4 seño «de retazos»
53 5. Diseño de cuatro grupos de Solomon 118 16. Análisis de discontinuidad en la regresión
53 Pruebas estadísticas para el diseño 5
54 6. Diseño de grupo de control con postes! únicamente 123 6. Diseños correlacionales y «ex post facto»
56 Aspectos estadísticos del diseño 6
57 Diseños factoriales 123 Correlación y causación
59 Interacción 127 El pretest retrospectivo
61 Clasificaciones inclusivas 128 Estudios en panel

156 157
Biblioteca de sociología

,l\,fichde Abbate, Libertad sociedad de masas


129 Diseño en panel con dos tandas (inaceptable) llayward R, Alker, El uso la matemática en el análisis político
El cuadro de dieciséis partes de Laz,nsfdd Pierre 11nsart, El nacimiento del anarquismo
131 Pierre Ansart, Las sociologías contemporáneas
134 Análisis ex post facto Dtwid E. Apter, Estudio de la modernización
Pctcr Bachrach, Crítica de la teoría elitista de la democraciri
138 7. Comentarios finales Brían M. Barry, Los sociólogos, los economistas y la dernocraciri
Rcinhard Bendix, Max Weber
Reinhard Bendix, Estado nacional y ciudadanía
140 Referencias bibliográficas Oliver Benson, El laboratorio de ciencia política
153 Indice onomástico Pcter L Berger, comp., Marxismo y sociología. Perspectivas desde Europa
oriental
Peter L. Berger y Thomas Luchmann, La construcción social de la realidad
Norman Birnbaum, La crisis de la sociedad industrial
Hubert M. Blalocli, Introducción a la investigación social
Thm Bottomore y Robert Nisbet, comps., Historia del análisis sociológico
Seueryn T Bru.yn, La perspectiva humana en sociología
Walter Buckley, La sociología y la teoría moderna de los sistemas
Donald 1: Campbell y Julian C. Stanlcy, Diseños experimentales y cuasi-
experimentales en la investigación social
Morris R. Cohen y Ernest Nagel, Introducción a la lógica y al método cien-
tífico, 2 vols.
Lewis A. Coser, Nuevos aportes a la teoría del conflicto social
11,fichel Crozier, El fenómeno burocrático, 2 vols.
1',fichel Crozier, La sociedad bloqueada
David Easton, Esquema para el análisis político
David Easton, comp., Enfoques sobre teoría política
S. N. Eisenstadt, Mo<lem.ización. Movimientos de protesta y cambio social
Raymond Firth, Elementos de antropología social
Robert W. Fríedrichs, Sociología de la sociología
Joseph Gabel, Sociología de la alienación
Anthony Giddens, Las nuevas reglas del método sociológico
Anthony Giddens, La constitución de la sociedad
Ervíng Goffman, Estigma. La identidad deteriorada
Erving Goffman, Internados. Ensayos sobre la situación social de los en-
fermos mentales
Erving Goffman, La presentación de la persona en la vida cotidiana
A!vin W Gouldner, La crisis de la sociología occidental
Daniel Guérin y Ernest Ilfondel, La concentración económica en Estados
Unidos

158

También podría gustarte