Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Campbell Stanley Disec3b1os Experimentales y Cuasiexperimentales en La Investigacic3b3n Social
Campbell Stanley Disec3b1os Experimentales y Cuasiexperimentales en La Investigacic3b3n Social
y cuasiexpcrimcntalcs
en la investigacin social
Disenos experimentales
y cuasiexperimentales
en la investigaci{>n social
Donald T. Campbcll
J ulian
( :. Stanlcy
Amorrortu editores
Buenos Aires
, 1' . . .
l i "' ' 1 ' :!.J
~-
.:!
~l
Nota preliminar
Impreso en los Talleres Cr:lficos Color Efe, Paso 192, Avellane<la, proncia ele Buenos Aires, en junio de 1()l)!J.
Tirada de esta edicin:
~.000
ejemplares.
l. Introduccin
ma
us
entes
!!JfcCall como
W /\. 1\1cCall
m
(
to
comenzaremos, pues,
Deca McCall en su
Y
que exponen el
cxpcrlmentalcs, pero muy pocos acerca
cmo obtener datos
<lclccuados y co_rrectos a los cuales
aplicar el
mtento cstadfsttco.
enunciado contina siendo
tan
cclto <.me
pu~de servirnos de leitmotiv. Aunque Ja
inf:lucncia de 11' co r nen.e
reme d la situacin en
aspectos fundamentales, su efecto ms
ha~e1 sidn c1 de afinar y perfeccionar el anlisis estr.,. ". :nas que el
ayudar a conseguir datos adecuados y
gulados por azar. As como se puede lograr la representativdad por el mtodo aleatorio ( ... ) tambin se puede
conseguir la equV<llencia por el mismo medio, siempre que
el nmero de sujetos que havan de utilizarse sea lo suficientemente grande,> ( P<g. 41). Tambin en otro punto se anticip a Pishcr: la introduccin del diseo del cuadrado latino
con el
de e:qx:rimcnto rotatorio, que por otra parte
habLm utilizado ya Thorndike, McCnll y Chapman [1916],
tanto en forma:; 5 >; 5 como 2 X 2, unos 10 aos antes de
que Fisher [ l 926] lo incorporase de modo sistemtico a su
esquema de dise1o exp;rmental con aleatorizacin."
La forma en que McClil utiliz, el ,<C.'Xpcrimento rotatorim>
ilustra muv bien el nfasis t<lnto de su obra como de la pre~cntc. El experimento rotatorio !;e introduce, no por razones
de cficienci,l, sino nis bien para logr,r algn control cuando
no es posible la a-;ign;lCn aleatoria
grupos equivalentes.
Con una intencin similar examinaremos aqu las imperfecciones de mucho~ programas experimentales, abogando no
obstante por su aplicacin en aquellas configuraciones en que
no hav<l modo de recurrir a mejores diseos experimentales.
En este sentido, b mayor pHrtc de los diseos analizados, incluso el <<experimento rotatorio no aleatorizado, se denominan disco<; cuasexpcrmentales.
~Otrec.OSt>.
:!"o a
mas tmportantc
f
" contribuc1'or1es
"
nava s!t
le ca . ot?;urlar la Igualacin preexpermental de gru;os por
aleatortzGcwn.
Esta .idea, )~ el consecuente rechazo de Ja tentativa de lleaar
a tallgua.la~tn por equiparacin (pese a su intuitiva atraccln
Y. potenc1ah~ad d~ error), no mereci Lcilmente la aprobacw,n de los }nvestJgador~s del ~mbto educacional. En 1923,
~c~all habla comprendtdo cuales eran Jos elementos cua. 1tat1vos fundamentales del problema. Dio, como primer mtodo para establecer grupos comparables, el de los grupos
10
En esta obra nos declaramos partidarios del mtodo experimental como nico medio de zanj,u las disputas relativas a
la prctica educacional, nica forma de verificar adelantos en
el campo pedaggico y nico mtodo para acumular un saber
al cual puedan introducrsclc mejoras sin correr el peligro de
que se descarten caprichosamente los conocimientos ya adquiridos a cambio de novedades de inferior calidad. Sin embargo,
con nuestra enrgica defensa de la experimentacin no pretendemos significar que este nfasis sea nuevo. Como lo manifiesta la existencia misma del libro de McCall, en tiempos
de Thorndike una ola de entusiasmo experimental recorra el
mbito de la educacin, alcanzando quiz su punto culminante
2 Kendall y Buckland [1957] afirman que el cuadrado latino fue in
ventado por el mattmtico Euler en 1782. Thorndike, Chapman y
~lcCall no utilizan esta expresin.
11
12
1.3
pm:s,
neccsmimncnte concon relacin al
tr,;dicional, sino ms bien
como rnccanismo de refinacin superpuesto a las
ncs prohablemen'lc valiosas de la prctica sensata.
pues, una ciencia
de la educacin no
pudbr el saber
Algnnos lectores abrgadn tal vez la
de que la ana~ogfa con el esquema evolutivo darwinano se complique con
factores de carcter especficamente humano. Cunndo
Prez, director de escuela, tiene que decidir entre adoptar un
libro de texto modificado o continuar con la versin anterior,
es probable que h<lga su eleccin fundndose en
insuficientes. Aparte de la eficiencia misma para la enseanza y
el aprendizaje, son muchas las consideraciones que habr de
tomar en cuenta. El director har lo correcto en una de estas
dos formas posibles: reteniendo el libro antiguo cuando sea tan
bueno o mejor que el revisado, o adoptando este ltimo cuando sea superior al primero. Pero puede equivocarse tambin
de dos maneras: reteniendo el libro antiguo cuando el nuevo
es mejor, o adoptando este cuando no es superior al primero.
En cada una de las dos elecciones errneas es de suponer que
se producirn inconvenientes diversos: 1) mayor costo finan
ciero y de gasto de energas; 2) costo para el director, en forma de quejas de los maestros, padres y miembros del consejo
escolar; 3) costo para los maestros, los alumnos y la sociedad
a causa de una peor instruccin. Estos costos, evaluados en
trminos de dinero, energa, confusin, menor aprendizaje y
mayor riesgo personal, deben sopesarse frente a la probabili
dad
que se produzca cada una de dichas alternativas, as
como la de que se detecte el error mismo. Si el director toma
su decsin sin
elementos
mc1o, fruto de una
investigacin a fondo, sobre el costo 3 (peor instr?ccin), es
posible
los costos 1 v 2. T.os
VIenen barajad?s en
un criterio co1~scrvdor: mantener el libro
antumo
un ao ms. Cabe, sin
tratar de prepar~~. un
con ambos libros a In vez, de acuerdo
con un esquema de tcorL1 de la decisin [ Chernoff .Y 1'v1oscs,
1959], adoplar un :e resolucin
tome explcitamente en
diversos costos
Cmc conseguir
excelente administrade teora de la
bien vale la pena
encarar.
ta;zto
captulos de esta
amc:nazan la validez
varios
cxpcrmen.
uno de dichos factores se
con todo dcta11c
Pv<>r"rr los diseos a propsito
los cuales constituye un
particular; diez de los
diseos se presentamtes de
la lista. A fin de lograr una perspecseria
sin embargo, que
tiva ms
una lista de dichos factores, as como una gua general acerca
de los cuadros 1, 2 y 3, que resumen parcialmente el anisis.
Es fnndmnental a este respecto distinguir bien entre validez
intcma y validez externa. Llamamos validez interna a la mni ..
ma imprescindible, sin la cual es impo~ible iD:terpretar el ~o
Introducan, en realidad, una d1ferenc1a los tratamienen este caso
concreto? Por su
externa plantea el interrogante de la posibiliA
poblaciones, situaciones, varade tratamiento
medicin puede
zarse este efecto?
criterios son sin duda importantes,
aunque con frecuencia se contrapongan, en el sentido de que
ciertos aspectos que favorecen a uno de ellos perjudican al
otro. Si bien la valde.z interna es el sine qua non, y a la cuestin de la validez cxterm~, como a la de la inferencia
tva, nunca se pHede responder plenamente, es obvio que nues-
tm ideal lo
vestigacin sohrc
de ensef:anza, donde el
ser la generalizacin a stu.;Jeiones prcticas de carcter conocido. T;mto las distiudoncs como las relaciones entre estos
dos tipos de consideraciones de validez irn
cxptci tas a medida que se las ilustre durante
de el iscos
Con relacin
distintas de
'5.
16
17
reactivos de los
que
hacer extensivo el efecto de la variable experimental a las personns expuestas a ella en una situacin no
experimental.
12. Illtcrferenclas de los tratamientos mltiples, que
producirse cuando se apliquen tratamientos mltiples a los
mismos
pues sm:lcn persistir los efectos de tratamientos anteriores. Este es un problema particular de los
diseos de un solo grupo de tipo 8 o 9.
En la presentacin de los diseos cxpetimen t<lles se adoptarn un cdigo y unos smbolos grficos unifotmes, a fin de
compendiar la mayora, si no la totalidad, de sus caractersticas
distintivas. Una X representar la exposicin del grupo a una
variable o acontecimiento experimental, cuyos efectos se han
de medir; O har
a algn proceso particular de observaci6n o medicin;
X y O en una fila dada se anlican
a las mismas personas especficas. La dimensin repres~ntncb
de izquierda a derecha indica el orden temporal, en tant)
que las X y O dispuestas en
vertical sealan la presencia
simultaneidad. Para hacer ciertas distinciones importantes, como entre los disc:fos 2 y 6 o entre el 4 y el 10 hav
que utilizar un smbolo R, que indica asignacin aleato~ia ~
diferentes grupos de tratamiento. Esa aleatorizacin se concibe
como un proceso que se produce en un momento dado, y sirve
para lograr, dentro de lmites estadsticos conocidos, la igualdi!d de los grupos antes del tratamiento. Agregaremos a ella
c:tra convencn .gr.fi.ca: las filas paralelas no separadas por
]mea de \>untos signtflcan grupos de comparacin no igualados
por dicho procedimiento. No se ha empleado ningn smbolo
para .la equipar~cin corno proceso para conseguir la igualacin
prev1.a al tratamiento de grupos de comparacin, porque el valor
de d1cho proceso se ha exagerado mucho y suele ms bien
conducir a inferencias errneas que contribuir a extraer conclusiones vlidas. (Vanse ms adelante el anlisis del diseo
1O y la seccin final sobre diseos correlacionales). En el diseo 9 se ha utilizado explcitamente un smbolo M para
identificar m a tcriales.
18
X O
19
La primera de estas hiptesis rivales no controladas es la historia. Entre 01 y o~ pueden haber ocurrido muchos otros
acontecimientos capaces de determinar cambios, adems de la
X sugerida por el experimentador. Si el pretest ( OI) y el
postest (o~) se administraron en das distintos, los acontecimientos intermedios pueden haber causado la diferencia. Para
20
21
Extnna
.:;
" o"
15"'
O
~
;
"2
f::
.,:;
..::;
--.
r:
"'a "
-~
"' 5
..-,:
:::J
:U
cr;
" "':l"
<;
::;
v
d..l
en
E
D
;:::
J)isnlos
;recxperimentales
l. Estudio de caso
COJI una sola
medicin
X o
Di:.:C'o prde.st-
pnste;-;t de
solo grupo
llTl
3. Comparacin ctm
un grupo esttico
X o
Di11 o~
cxperimentrtl(:s
propiamente dichos
4. Di.cwo de
grupo (h con troJ
+ +
+ +
+ +
+ + + +
prch~t-po.<>t(:;t
R
1l.
o
o
o
o
5. Diseo de cuatro
grupos de
Snlmnoll
H () X
ll o
R
R
f-
o
o
o
o
l. Dist>fio de gniJHl
f.1e control con
postcst
l'tnicnmentc
X o
confundirse con el
de una X correctiva.
nc se considera
Ni que decir tiene que tal
tnea >> en ningn sentido causal, sino que representa ms
los
acumulativos de los procesos
aprendizaje y prede la experiencia global diaria, que se proaunque no se hubiese introducido ninguna X.)
Una tercera explicacin rival entremezclada es el efecto de la
de pruebas, el efecto del prctest mismo. En pruercndimiento e inteligencia,
estudiantes a quienes se
somete a ellas por segunda ve;~, o a untl de sus variantes,
etc., suelen desempci1arse mej0r
l0s que las encaran por
vez primera [p. ej., Anastasi, 1
190-91; Cane y
1950]. Esos efectos, que alcanzan de 3 a 5 puntos
de
en promedio para sujetos sin experiencia previa, se proacerca de sus
ducen aun sin haberles hecho comentario
errores en el test anterior.
las pruebas de
se advierte un resultado
en las segundas
en general, un mejor ajuste, aunque en ocasiones
se halla tambin un efecto altamente significativo en senddo
contrario [ \vindle, 19541. En cuanto a las actitudes hacia
grupos minoritm:ios, una segunda prueba suele indic,u un mayor prcjnido, aunque los datos disponibles son todava escasos [Rankin y Campbell, 19'55]. Es obvio que el anonimato,
una mavor conci~encia de qu respuesta es la socialmente
<lprobada, etc., influiran en general sobre la ndole del resulanonimato, el
tado. Para tests de prejuicio en condiciones
r:ivd de
creado por las expresiones hostiles presenmodificar las apreciaciones del
en lo
tadas
a la tolerancia que existe para actitudes de mayor hostilidad. En un inventario de adaptacin o de personalidad que lleva la firm<J del sujeto, la
administracin del test forma parte de una situacin
solucin de prohlcmas en que el estudiante trata de descubrir el propsito
oculto de la prueba. Si ya ha pasado por aquella experiencia
(o si habl con sus amigos sobre las respuestas que ellos dieron a algunos
los puntos ms destacados), sabe mejor cmo comportarse la segunda vez.
Con el problema
los efectos del test se relaciona la distincin entre las posibles mediciones de su reactividad, lo cual
constituir un importante tema en todo este libro, as como
una exhortacin general a que se hagan mediciones no reactivas siempre que sea posible. Desde hace mucho tiempo ha
sido una verdad manifiesta en las ciencias sociales que el proceso mismo de medicin puede hacer cambiar aquello que se
23
mide. La ganancia test-retest sera una importante consecuencia de ese cambio. (Otra, la interaccin entre la realizacin de
la prueba y X, la estudiaremos Im1s adelante, junto con el diseo 4. Adems, es importante evitar esas reacciones al pretest, aun cuando surtan efectos diferentes para sujetos clistir>
tos.) Es de esperar el efecto reactivo siempre que el proceso
de prueba sea en s un estmulo al cambio, y no un mero registro ele comportamiento. As, en un experimento sobre terapia para el control del peso, el pesaje inicial puede ser ele
suyo un estmulo para el adelgazamiento, aun sin tratamiento
curativo alguno. De manera similar, la ubicacin ele observadores en el aula para estudiar la capacidad prcentrenamienlo
del docente en el mbito de las rebciones humanas puede modificar de por s su forma ele comport~1rsc. La colocacin de un
rnicnfono sobre el escritorio o pupitre suele variar la pauta
de interaccin del grupo, etc. En general, cuanto ms nuevo y
motivan te sea el clemen to utilizado para las pruebas, mayor
ser su influencia.
La iiiStrumentacin o deterioro de los instrumentos [ cf.
Campbell, 19 57] es el trmino con que se designa una cuarta
hiptesis rival no controlada. Esa expresin se refiere a las
variaciones autnomas en el instrumento de medicin que podran ser la causa de una diferencia 01- 02. Tales cambios
seran anlogos a la mayor o menor tensin observada en el
dinammetro, la condensacin en una cmara de niebla, etc.
Cuando se recurre a observadores humanos a fin de obtener
01 y 02, su propio aprendizaje, tensin, etc., determinarn
02. Si se califican los ejercicios de redifc:rencias de 01
daccin, ensayos o trabajos de investigacin, los estndarc:s
aplicados variadn de 01 a 0:2 (la tcnica de control sugiere que se mezclen los ejercicios de redaccin 0 1 y 0 2 y se
los haga calificar sin tener conocimiento de cul ha llerrado
primero). Si se observa la participacin en el aula, tat"' vez
en la segunda sesin los observadores sean ms h<biles, o ms
indiferentes. Si se entrevista a los padres, la familiaridad de
quien realiza esa labor con el programa de entrevistas y con
determinados padres puede producir ciertos desplazamientos.
Un cambio en los observadores entre 0 1 y 0 2 tambin podra
provocar alguna diferencia.
Una quinta variable entremezclada en algunos casos del diseo 2 es la regresin estadstica. Por ejemplo, si en una
prue~a correctiva se seleccionan alumnos para un experimento
espec1al porque han tenido puntajes particularmente bajos en
el test de rendimiento escolar (que para ellos se convierte en
OI), en una prueba posterior en que se adopte la misma forma de antes u otra similar a ella, casi con segurid>h 0 2 tendr
para ese grupo un promedio ms elevado que 01. Este resul..
tado confiable no se deber a ningn efecto Penuino de X a
ningn efecto de la pdctica de test y retest, ~te. Es ms bien
un aspecto tautolgico de la correlacin imperfecta entre 0 1
y 02. Los errores de inferencia ocasionados por no haber
tomado en cuenta el .efecto de la regresin han planteado tantos problemas en la investigacin educacional porque muy a
menudo se desconoce su verdadera naturaleza -aun por estudiantes que han realizado cursos avanzados de estadstica mo
derna-. Como en exposiciones posteriores (p. ej., el diseo
1 O y el anlisis ex post jacto) la daremos por conocida, nos
detendremos aqu a explicarla brevemente, aunque sea en
forma muy elemental. La figura 1 presenta algunos datos
imaginarios en los que el pretest y el postest de una poblacin
entera tienen una correlacin de 0,50, sin variacin en la
media grupal o variabilidad. (Los datos se seleccionaron ex
prcsamente para que la colocacin de las medias de fila y
columna sean obvias a la simple observacin visual. El valor
de 0,50 tambin se elige por conveniencia de exposicin.) En
este caso hipottico no se ha producido ningn camoio real,
pero, como es corriente, los puntajes falibles del test indican
una correlacin de retcst considerablemente inferior a la unidad. Si, como se sugiri en el ejemplo dado antes, comenza-
mos por observar solo a los escolares calificados con puntajes
muy bajos en el pret:est -p. ej., 7 puntos--, y en el postest solo reparamos en el puntaje de esos alumnos, nos encontraremos con que los puntajes postest estn dispersos, pero
son en general mejores, y en promedio regresionar011
hacia la media grupal con un coeficiente de regresin o correlacin de 0,50, obteniendo una media de 8,5. No obstante,
en vez de constituir una prueba de progreso, esto es una ratificaci(n tautolgica, si bien especfica, de que hay una correlacin imperfecta, y de cul es su medida.
Cuando al trascurrir el tiempo se producen acontecimientos
entre el pretest y el postest, nos sentimos tentados a establecer una relacin causal entre dicho cambio y la accin espe
cfica del paso del tiempo. Pero obsrvese que cabe hacer
aqu un anlisis cronolgico a la inversa, comenzando, por
ejemplo, con aquellos cuyo puntaje postest es 7 y observando la dispersin de sus puntajes pretest, de los cuales se
extraera la implicacin inversa, a saber: que los puntajes van
empeorando.
24
25
1, Regresin en la prediccin de
pretest, y viceversa.
postest
dequ<: indica
prediccin
a pos test
Pl!nlc!I'S pOSl(',;ts
M edicto>
g
pretests
')
!O
)'OSIC'SIS
11.5
ll,O
L?
,-,
11
lO
9,5
!2
1
00
\Jl
,_..
\0
vo
\D
V.
,_..
o
V.
(a)
Prediccin
De grupos
A medi~s
prercsts
---Jo- postcsls
homor1;neos
>-'
V.
Lnea de regreslOn c.
que indica la mejor
prediccin de postes!
a pretest
Ptedccin
A medias
12
11
11
9
g
7
.-------;;
...--------/~
/
(b)
postesl:s
hon1ng(~nct )S
10
De grupos
pretests -
26
,....
10
<)
R
7
..
.,.____________.,
~
~
(e)
28
29
bre los efectos de la formacin universltaria cuando se comparan las med!ciones ~fectuadas entre alumn~s recin ingresados (que no nan temdo la X) y los que estn a punto de
egr~sar ( qu~ Ja ~an tenido)_ Si esos estudios indicaran que las
mujeres reCien mgresadas son ms bellas que las que estn
por graduarse, recha7:aramos de plano la consecuencia lgica
de que nuestro duro curso de capacitacin menoscaba la belleza femenina, y sealaramos e_n su lugar las dificultades que
encuentra una muchacha agraciada para finalizar su carrera
antes c~e contrae~ matrimonio. Este efecto se clasifica como
m?rtalzdad expenmental. (Por supuesto, si observamos a las
mtsmas muchachas cuando acahan de ingresar y cuando egresan, este problema desaparece, con lo cual tenemos el diseo 2.)
30
disei1os expcrirnentales
dichos
31
32
33
n1ayores
re:mente
como para
debern ignorar
de los distintos
ese hecho no se~gue sus
al sesgo so1 causas
firma la
con un segundo
estudios r~Tentes
va
Se elimina
seleccin como explicacin
la medida en que la aleatorzacin haya "e'~"""'"
grupal en el momento
medida que
nuestra estadst ca
muestreo. As,
l~S mayor
que para pequeas
Este supuesto fallar en ocasiones en el
naciones
grado sugerido por el trmino de error para la hiptesis de no
diferencia. En el diseo 4, ello significa que a veces habr
una aparente
significativa entre los puntajes pretest. Por lo
la aleatorizacin simple o estratifi..
cada asegura la
no sesgada a los grupos de
experimentales, constituye un medio muy imperfecto para garantizar la equivalencia inicial de dichos grupos. No obstante,
es la nica forma
de hacerlo. Lo decimos
tan
categricamente, a causa
una muy difundida y errnea pre-
34
35
Uphoff, 1939;
de h1 interaccin
36
37
re~; u} LJ as atractiva a
tiene
cun ~odr
que se
ha sossin rnol ivo en el lJ':tl.amcnto formd cornn sobre rw.:tc
El anlisis
CXlL'YUi
dectos evidentes
sumaran
los de X en el
propio del
vanancws
n:a[iza'Cin de
, etc . - se
efectos principales, y como tales se
ha con
ofKio en d disee- 4, dndole validez interna, Las mnenaz:as
a b validez externa, por otra parte, pueden considerarse efectos k interaccin entre X y alguna otra variable. Constituyen,
1rna posible especificidad de los efectos de X respecto
conjunto de condiciones inconvenientemente limitaanticipo diremos que, hasta donde nosotros sabeBY''''
4 los efectos observados de X pueden ser
cs;;;:~:ificos de gmpos cuyo inters fue intensificado por d
pretest. Corno es natural, no podemos extender nuestras conclusiones al conjunto mayor no sometido a prctest, <lcerca del
cmd desearamos cxtmer conclusiones.
En este captulo cxnminaremos unas cu::mtas de esas amenazas
a la posibilidad de generalizacin, as como los procedimientos
para sortearas. Es decir que se prefieren estos diseos por razones de validez externa o posibilidad de generalizacin, dado
que hay diseos vlidos que evitan el pretest y en muchas
situaciones (aunque no necesariamente en la investigacin educacional) se desea generalizar precisamente con respecto a los
grupos no sometidos a pretest. En el campo de la docencia
constituyen juicios acerca de la validez externa las dudas que
con frecuencia se expresan sobre la aplicabilidad prctica de
los resultados de ciertos experimentos muy artificiales. La introduccin de tales consideraciones en el anlisis de los me38
bci6n en un
, ha
1 ~
: lCtleEnos
dccto ;ucda
.
m::' cspcnf1cas que el
1wn ..:u cornn, es decir,
en rel:win con
prctcst, pero de determinada
snci ucconm ica, regin
\'in csLcbr, orientacin
cam:Jo
nivel de radiaciones g1mrna, ctci;lera
punto
vista
no
ms
,,IJ: de dichos lmites; es
que nu podemos generalizar
er1 modo alguno. Pero tratamos de hacerlo conjeturando
y verificando algunas de dchas generalizaciones en Otras mn
dicioncs no menos especficas pero diferente3, A
largo de
la l1isloria dr:: cada una de las ciencias, se aprcndea justificm>
bs generalizaciones propias de ella a causa de la acumulacin
misma de la experiencia en hacerlo, pero no es esa una generalizacin lgica, deducible de los resultados del experimento
miginal. En esa situacin hacemos, al generali:.oar, suposiciones
sobre leyes an no demostradas, incluyendo algunas que ni si
quiera se indagaron. As, en la investigacin educacional, suponemos por lo comn que la orientacin del campo magnticn no la afecta. Pero sabemos de ciertos estudios que con
frecuencia el pretest ha tenido un efecto, y por lo tanto quisir;1mos eliminarlo como obstculo para nuestra generalizacin.
Si hiciramos una investigacin sobre barras de hierro, sabra-
'(_;s }Cctivas.
39
Interaccin de las pruebas y X. En estudios del diseo experien s, el peligro que constituye el pretest para la valexterna fue denunciado por primera vez por Solomon
[ 1949], aunque idnticas consideraciones haban llevado an-
40
41
mos por la
que una primera pesada nunca produce efe~tos
pero que la orientacin del campo magntico, si no se la regulara de manera sistemtica, podra limitar
gravemente la posibilidad de generalizar nuestros descubrimientos. Los motivos, pues, de invalidacin externa son presunciones de leyes generales en la ciencia de una ciencia: conjeturas acerca de los bctores qne pueden intetactuar con nuestras
de tratamiento segn cierta
y, por lo tanto,
los que pueden dejarse de lado.
de los
especficos existe una ley general
que nosotros, :1s como el resto
los hombres de
aceptamos como ;,upucsto: es la versin moderna de
"'"<Pete de Mill acerca de la <<legalidad de la naturaleza.
Esa versin, menos tajante y drstica, puede enunciarse como el supuesto del aglutinamiento ( stickiness) de la na tu~
ralczc1: cuanto ms cercanos se hallan dos acontecimientos en
tiempo, espado y valor -medido este en cualquiera de sus
dimensiones o en todas ellas-, ms tienden a ajustarse a las
mismas leyes. Si bien las interacciones complejas v las relaciones curvilneas habrn de confundir presumiblemente los intentos de generalizacin, tal posibilidad aumenta en relacin
directa con el grado en que la situacin experimental difiere
de la si tu acin con respecto a la cual se desea generalizar,
Nuestra necesidad de una mayor validez externa ser pues, el
requerimiento de la mxima similitud entre experi~entos y
condiciones de aplicacin que sea compatible con la valiaez
interna.
Tngase en cuenta, en este sentido, que las ciencias ms
prsperas, como la fsica y la qumica, han avanzado sin
prestnr la menor atencin a Ja represent:atividad (aunque s, y
mucha, a la reiterabilidad por parte de investigadores ind). Un laboratorio artificial dentro de una torre de
marfl quiz sea una maravilla, pero no ser representativo, y
a menudo la artificialidad puede resultar imprescindible si se
quiere s.ep?rar analticamente variables fundamentales para
descubnm1entos de muchas ciencias. Pero, sin duda, si no incon la validez interna o el anlisis, la validez externa
es un~ co~sider?cin de la mayor importancia, sobre todo pra
una ocncJa aplicada como es la pedagoga.
42
por realizar un estudio dentro de una nica escuela voluntaria, empleando la asignacin aleatoria de suietos a grupos ~x
perimentales y de control, no nos preocupana el efecto prmcipal de la escuela en s. Si este factor elevara por igual ~a
media del grupo experimental y la del de control, no se caus~tla
dao alguno. Pero si existiesen en la escuela caractersticas
que hicieran ms eficaz al tratamiento e~perimental en ella
que en la poblacin de escuelas que consutuyen el verdadero
objetivo de la prueba, las consecuencias podran ser graves.
Queremos estar seguros de que puede menospreciarse la interaccin entre las caractersticas de la escuela (probablemente
relacionadas con el hecho de que es voluntaria) y los tratamientos experimentales aplicados. Algunas variables experimentales podran ser bastante sensibles a las caractersticas de
la escuela, lo cual quiere decir que interactuaran con ellas;
otras, no. La interaccin podra darse en escu~las co.n CI
medios similares, o no presentarse all donde las t!lferenoas de
CI fuesen elevadas. Sera de esperar, sin embargo, una mayor
probabilidad de interaccin si las escuelas difiriesen mucho en
distintas caractersticas que si fuesen anlogas.
A menudo se producen importantes sesgos de muestreo a cau ..
sa de la inercia de los experimentadores, que no conceden a
una seleccin ms representativa de escuelas la oportunidad
de negarse a participar. De ah que la mayora d~ l.as investigaciones sobre educacin se ~wgan en los est~.blecumentos que
cuentan con mayor porcentaJe de alumnos ht)Os de profesores
universitarios. Aunque es imposible la representatvidad perfecta en el muestreo, y aun se la descuida casi en absoluto .en
muchas ciencias (por ejemplo, en la mayora de los estudios
publicados en el ]ournal of Experimen~al ~sychology) '. pued.e
y debe aspirarse a ella como a un destderatum en la m':estlgadn educacional. Una forma de aumentarla es reducir el
nmero de alumnos o aulas participantes que pertenezcan a
un coleaio o nivel dado y aumentar la cantidad de escuelas y
niveles ~n que se lleve a cabo el experimento. Es obvio que
nunca vamos a realizar experimentos sobre muestras que representen a todas las aulas de Estados Unidos o del mundo.
Solo poco a poco aprenderemos hasta dn~e se puede g~nera
lizar un descubrimiento internamente. vhdo, por m~d10 de
comprobaciones empricas en ese sent1do. Pero t.ales mtentos
de generalizacin tendrn xito ms ,a menudo si en el .experimento original se demuestra el fenomeno en una ampha variedad de condiciones.
En cuanto a los signos positivos y negativos que aparecen en
43
el cuadro 1, resulta evidente que nada seguro puede consignarse en esa columna. Se la presenta, no obstante, porque los requisitos de algunos diseos exageran o atenan la gravedad
de este problema. El diseo 4, dentro del mbito de las actitudes sociales, es tan exigente en lo que a cooperacin por
parte de los participantes se refiere, que en definitiva la investigacin solo se hace con un pblico cautivo en vez de realizarla con ciudadanos comunes, que son a quienes quisiramos
referirnos. En una situacin de esa ndole, el diseo 4 merecera un signo negativo en cuanto a seleccin. No obstante,
en la investigacin pedaggica nuestro universo de inters est
constituido por un pblico cautivo para el cual se pueden obtener diseos 4 de elevada representatvidad.
Otras intertlcciones con X. De manera parecida, las interacciones de X con los dems factores pueden examinarse como
amenazas a b validez externa. La mortalidad diferencial sera
un prodncto de X y no una interaccin con ella. La interaccin
de la instrumentacin con X se ha incluido implcitamente en
el ani'lisis de validez interna, ya que un efecto especfico de
instrumentacin ante la presencia de X falseara el verdadero
efecto de X (p. ej., cuando los observadores asignan puntajes,
conocen las hiptesis y saben cules son los estudiantes que
recibieron X). Una amenaza a la validez externa es la posibilidad de que los efectos sean especficos de los instrumentos
paniculares (tests, observadores, medidores, etc.) empleados
en el estudio. Si en todos los tratamientos se utilzan observadores o entrevistadores mltiples, tales interacciones pueden estudiarse directamente [Stanley, 1961a]. La regresin
no interacciona con X.
La maduracin tiene consecuencias de especificidad de seleccin: los resultados pueden ser especficos de un determinado grupo ctario, del cansancio, etc. La interaccin de la
bisLoria y X implicara que el efecto haba sido especfico de
las condiciones histricas del experimento, y aunque su observacin es vlida, no se lo hallara en otras.
El hecho de que . el experimento se llevase a cabo en el
trascurso de una guerra, o a continuacin de haber fracasado
una huelga de maestros, etc., podra producir una reaccin
frente a X que no aparecera en otras circunstancias. Si tuvisemos que preparar un modelo de muestreo para este problema, nos gustara que el experimento se repitiese en una
muestra aleatoria de ocasiones pretritas y futuras, lo cual,
como es obvio, resulta imposible. Adems, compartimos con
44
de gr:ncnd izarse
otras situaciones
Cualquier aspecto del procedimiento experimental puede producir ese resultado de dispositivos reactivos. La administracin
de pretests, prescindiendo de su contenido, puede hacerlo, y
parte de la interaccin del pretest con X puede ser de ese
tipo, aunque hay poderosas razones para sospechar de los aspectos mismos de contenido de la aplicacin del test. El sistema de aleatorizacin y asignacin a tratamientos quiz sea
de esa ndole. Consideremos el efecto que se produce sobre
una clase cuando (como en Solomon [ 1949] se hace pasar
a una habitacin separada a la mitad de los alumnos, elegidos al azar. Ese acto, ms la presencia de maestros extraos, tiene qne crear por fuerza expectaciones de hechos
desusados, snscitndose as el asombro y una activa curiosidad en cuanto a su objeto y finalidad. La presentacin del
tratamiento X, si fuese un acontecimiento inusitado, podra
tener un efecto similar. Es de presumir que aun el postest, en
un diseo 6 de postest solamente, podra crear esas mismas
actitudes. Cuanto ms evidente sea la conexin entre el tratamiento experimental y el contenido postest, ms probable
ser ese efecto.
En d campo de los cambios de opinin pblica, esos dispositivos reactivos suelen ser difciles de evitar. Pero en la mayor
parte de la investigacin de mtodos educativos no hay necesidad de que los estudiantes sepan que se est realizando un
experimento. (Sera muy conveniente que tambin los maestros lo ignorasen, a la manera del doble ciego en medicina,
pero por lo comn esto suele ser imposible.) Varios recursos
permiten disimularlo. Si las X son variables sobre acontecimientos usuales en el aula, pero que se producen a intervalos
bastante largos dentro del calendario escolar, un tercio de la
batalla se habr ganado si los tratamientos mencionados se
aplican sin previo anuncio. En forma similar, si se incluyen
las O en exmenes regulares, se llena el segundo requisito.
Si las X son comunicaciones centradas en determinados estudiantes, puede lograrse la aleatorizacin sin necesidad de trasportar fsicamente muestras aleatorias equivalentes a aulas
distintas, etctera.
A la luz de estas consideraciones, as como de observaciones
personales de los experimentadores que han publicado datos
pese a tener un rapport tan pobre que sus hallazgos eran bastante engaosos, los autores del presente volumen van llegando poco a poco a la conclusin de que la experimentacin
dentro de las escuelas debe realizarse, siempre que sea posible, con el personal regular de ella, en especial cuando los
46
47
pretest el
examen objetivo
en
clase. Arrojando un
especial, el maestro
alumnos a grupos
de tratamiento y, segn los Cilsos,
o no comentarlos
escritos a la prueba. La siguiente
objetiva, tomada de
acuerdo con la progrnmacin normal, pas a ser el postes t.
Hasta donde pudo determinarse, ninguno de los 2.139 alumn<:s se ente~ de J: experimentacin. Ptlcos son los procedimientos
mstn!CCJOllL'S que se prestan a est; tan disimulada
ya que por lo comn la comunicacin oral neccsar:l.se.
a to~la L1
y no a
individuos. (L1s
comunlcanones esctJtas permiten
aunque la
por parte del
ntos trataconstituye un problema.
investig:Hlores pueden
que los
tengan menos carnctersticas reactivas que en la actualidad.
Por
de exmenes regulares tomados en el aula, o tests
presentados corno exmenes regulares y anlogos en su contcmdo, a la vez que mediante procedimientos altcrn<Jtivos
de enseanza prcsenta_dos, sin previo aviso ni peticin de
en d curso de las actividades escolares, es probable
de los casos puedan ev tarse estas
caureactivos. A
en grandes escuelas ~eo en universidades
alumnos se inscriben
en cursos populares dictados en determinados horarios
se
asigna en forma
a mltiples
.
. podran lograrse
de equivalencia
tona medt:mte el control del proceso
asignacin (vase en
y S1egel r1957] la aplicacin de un proceso aleatorio
natun~l, que se. apr:Jvech en esta forma). Sin embargo, por
la ac~K?n de ~tstonas
nicas, tales secciones, al
prmnp1o eqUlvalcntes,, se .tornan. con el correr del tiempo en
segmentos cada vez mas dJferer.crados.
Lr solucin a este problema,
en J!,eneral, es trasladar la
al aula .
como unidad y consttur
experimentales y de
constituido cada uno de
muchas aulas
azar !vase Lindquist,
1940, 953]. Por lo comn, aunque no es imprescindible
f~cto
cursos se clasificaran para su anlisis sobre la base
res corn<? escuela, J~aes:ro o (
este tenga varias
},
hor:, as1gnatura, m ve] Intelectual medio, etc.; de ellos se
nanm: por un proceso aleatorio varios grupos de tratamiento
~xpenmental. Ya se han realizado algunos estudios de est,1
mdole, pero creemos que pronto se generalizarn. Ntese
el test de significacin apropiado no consiste en mezclar
48
49
~-. ,.;,
51
No hay ningn procedimiento estadstico particular que utilice a un mismo tiempo los seis conjuntos de observaciones.
Las :::simetras del diseo descartan el anlisis de la variancia
52
53
'1.
R 01 X 02
R 0:1
04
R
X 0:;
R
06
Tra;o,mdo u1 forma paralela los elementos del diseo 4 ( 0 1
a ) con los grupos experimental y de control sin pretest,
cabe determinar tanto Jos efectos principales de la realizacin
de la pruc!Ja como la interaccin entre ella y X. De ese modo,
no solo se <1tlmenta la posibilidad de generalizar, sino que
adems se repite el efecto de X en cuatro formas diferentes:
02
01, o~ > 04, 0:. > Oa y 05 > Oa. Las inestabilidades
concretas de la experimentacin son tales que, si esas comparaciones concuerdan, el vigor de la inferencia queda muy incrementa(1o. Otra contribucin indirecta a la posibilidad de generalizar los hallazgos experimentales es tambin que, en virtud de la experiencia con el diseo 5 en cualquier mbito de
investigacin dado, se averigua la posibilidad general de interacciones de pruebas por X, pudindose as interpretar
mejor los diseos 4, tanto futuros como pasados. Asimismo,
puede advertirse (comparando Oe con 01 y O:J) un efecto
combinado de maduracin e historia.
Pruebas estadsticas para el diseo 5
, 1~: la informacin presentada al jurado por el abogado defen' ll'. El diseo 6 responde a esa necesidad, y adems es aproiado para todas las situaciones en que podran utilizarse los
diseos 4 o 5, es decir, aquellas en que es posible una verdadera alcatorizacin. Su forma es la siguiente:
Sin X
54
55
Sobre la base
las medias de las columnas se estima el
efecto principal de X; de las medias de las filas, el efecto
casilleros, la
principal del pretest y de las medins ele
intc:raccin entre la aplicacin del t<.:st y X. Si los efectos
principales <.: interactivos de la aplicacin de las pruebas son
muy pequeos, acaso sea conveniente realiz<lr un an1lisis de
covariancia de O, contra 0 2 , con los puntajes del pretest por
covariable.
Diseos factoriales
56
'57
Interaccin
origen de la enorme brecha que separa las metodologas avanzadas ?e las tradicionales en el mbito de la investigacion
educacJonal. Esperamos que esta obra ayude a salvar ese vado
por medio de una continuidad con la metodologa tradicional
y las consideraciones dictadas por el sentido comn qlle el estudiante lleva siempre consigo. Tambin estimamos que gran
parte de lo que debe ensearse sobre disef:io experimental se
entiende mejor si se lo expone en forma de diseos de dos
tratamientos, sin interferencia de otras complicaciones. No
obstante, la exposicn completa de los problemas planteados
por el uso comn provocar una comprensin mayor tanto de
ln necesidad como de la localiz,cin de modernos enfoques.
Al bus~ar la ~or~a ms efic~z de resumir el anticuado pero tan
dlfund1do dtseno 4 nos vunos ya constreidos a disponer
de un anlisis de covariancia, casi no utilizado en esta situacin. Y en el disefio 5, con un problema de dos tratamientos
que se elabora slo para obtener controles necesarios, nos
a!ejamos de las relaciones crticas o pruebas t, y nos introducunos en la estadstica del anlisis de varianca.
Los detalles de los anlisis estadsticos para diseos factoriales no pueden ensearse ni aun esbozarse siquiera en esta
obra. Edwards [1960], Ferguson [1959], Tohnson y Jackson
[1959] y Lindqust [1953] presentan a -los investigadores
P.edaggcos aspectos elementales de tales mtodos. Confiamos,
stn embargo, en que las explicaciones siguientes permitirn
~lguna rnnyor c~lmprensin de ciertas alternativas y compleJldades de particular relevancia en los aspectos de diseo
anali?:ado~ en nuestra obra. Las complejidades que tenemos
que anaiJzar no comprenden !as razones comunes para recurrir a cuadrados latinos ni a muchos otros diseos incompletos en que el conocimiento de ciertas interacciones se sacrifica por meras razones de costo. (Pero el uso de cuadrados
btinos como sustituto de los grupos de control en los casos
en que no hay modo de aleatorizar se estudiar 1ms adelante
como diseo cuasiexperimental 11.) La razn de haber pres~
cindido aqu de esos diseos incompletos es que para el
problema de validez externa resulta muv conveniente contar
con un conocimiento detallado de las int~racciones, sobre todo
en una ciencia que ha tenido problemas para repetir los de~
cubrimientos de un investigador en otro ambiente distinto
[vase Wilk y Kempthome, 1957]. Los conceptos que tratamos de exponer en este captulo son los de la nteraccp
las clasificaciones inclusivas y las clasificaciones cruzadas, y lo~
modelos factoriales finitos, fijos, aleatorios y mixtos.
\'a hemos utilizado este concepto en situaciones en que, segn creemos, el lector no especializado lo habr encontrado
comprensible. Como antes, insistimos aqu en las consecuencias relativas a la posibilidad de generalizar. Expondremos en
forma grfica (figura 2) cinco posibles resultados de un diseo con tres niveles, compuesto cada uno de ellos de Xa y
Xb, que denominaremos A y B. (Puesto qu.e se han de graficar tres dimensiones [A, B y O] en dos, son varias las
presentaciones que resultan posibles, de las cuales no emplearemos m1s que una.) En la figura 2(a) puede apreciarse un
notable efecto principal tanto para A como para B, pero ninguna interaccin. (Hay, por supuesto, una suma de efectos
~siendo A:, Ba el ms fuerte-, pero ninguna interaccin,
ya que los efectos son aditivos.) En todos los dems casos
encontramos interacciones significativas adicionales, o bien en
reemplazo de los efectos principales de A y B. Es decir que la
ley sobre el efecto de A vara de acuerdo con el valor especfico de B.
En este sentido, los efectos de interaccin son reglas de especificidad de efecto y, por tanto, conducen al intento de generalizacin. El efecto de interaccin en 2(d) es, sin duda
alguna, de ese orden. Aqu, A no produce un efecto principal
(es decir que, si se promedian los valores de las tres B pa,ra
cada A, resulta una lnea horizontal). Pero cuando se mantiene B en el nivel 1, los aumentos en A producen un efecto
decreciente, en tanto que si se mantiene B en d nivel 3, A
tiene un efecto incremental. Ntese gue si el experimentador
slo hubiese variado A, manteniendo B constante en el nivel
, los resultados, aunque internamente vlidos, hubiesen dado
pie a que se hiciesen generalizaciones errneas a propsito de
B2 y Ba. La caracterstica de mltiple factorial del diseo ha
llevado, pues, a realizar valiosas exploraciones sobre la posible generalizacin o validez externa de cualquier enunciacin
sumaria sobre el efecto principal de A. Las limitaciones de la
posibilidad de generalizar o de la espeficidad de los efectos
aparecen en el anlisis estadstico como interacciones significativas.
La figura 2( e) representa una forma de interaccin an m~s
extrema: ni A ni B producen efecto principal alguno (no resultan reglas generales sobre qu nivel de ambas es mejor)
pero las interacciones son fuertes y bien definidas. Consideremos un resultado hipottico de esta ndole. Supongamos
58
59
Grados de O
~
1
(a)
~:'
~~Jj
A
A.t
A,
Grados de O
!
Grados de O
(e)
(d)
~B,
~:'
A,
A.,
A,
Grados de O
(e)
A,
A,
60
A,
En los ejemplos dados hasta aqu, todos los criterios de clasificacin (las A y las B) se han cruzado con todos los
dems criterios. Es decir que todos los niveles de A se han
dado con todos los niveles de B. Sin embargo, el anlisis
de variancia no se limita a esa situacin.
Hasta ahora hemos utilizado, a ttulo de ilustracin, criterios
61
lo comn inclusivos dentro de las escuelas, ya que lo habitual es que un maestro d clases en un solo colegio. En
este caso es concebible una interaccin maestro-escuela, pero
no se la podra computar a menos que todos los maestros
enseasen en uno y otro establecimiento, en cuyo caso maestros y escuelas seran cruzados, no inclusivos.
A los alumnos, o sujetos de un experimento, tambin se los
puede tratar como criterio de clasificacin. En un mecanismo
totalmente cruzado, a cada alumno se lo somete a cada uno
de los distintos tratamientos, pero en muchos casos entra en
varios, aunque no en todos, los tratamientos; es decir que
no se produce el fenmeno ele la inclusin. Un caso frecuente
es el estudio, durante el aprendizaje, de datos obtenidos por
pruebas individuales. Aqu podramos tener curvas de aprendizaje para los distintos alumnos, divididos estos entre dos
mtodos de estudio. Podran analizarse las interacciones prueba-mtodo y alumno-prueba, pero no alumno-mtodo. Si a
los alumnos se los clasifica por el sexo, se genera tambin
un fenmeno de inclusin.
Casi todas las variables de inters en la experimentacin educacional pueden cruzarse con otras variables y no tienen por
qu ser objeto de inclusin. Excepciones notables, adems de
las ya mencionadas, son la edad cronolgica, la edad mental,
el grado escolar (primero, segundo, etc.) y el nivel sociocconmico. El lector inteligente habr notado que las variables
independientes, o los criterios de clasificacin, pertenecen a
distintos tipos: 1) variables manipuladas, como el mtodo
de enseanza, que el experimentador puede asignar a voluntad; 2) aspectos potencialmente manipulables, como materias estudiadas, que el experimentador podra asignar de alguna manera aleatoria entre los alumnos que utiliza, pero
que rara vez lo hace; 3) aspectos relativamente fijos del
ambiente, como comunidad, escuela o nivel socioeconmico,
fuera del control directo del experimentador pero que sirven
de bases explcitas para la estratificacin de la prueba; 4) caractersticas orgnicas de los alumnos, como edad, estatura,
peso y sexo, y 5) caractersticas de reaccin de los alumnos,
como puntajes en distintos tests. Por lo comn las variables
independientes manipuladas de la clase 1 son de inters fundamental, mientras que las variables independientes no roamanipuladas de las clases 3, 4 y a veces 5 sirven para aumentar
la precisin y revelar hasta qu punto son generalizables los
efectos de las variables manipuladas. Las variables de clase 5
aparecen de ordinario como covariables o variables depen
62
63
dientes. Otra forma de considerar las variables independientes es como intrnsecamente ordenadas (grado, nivel socioeconmico, estatura, pruebas, etc.) o no ordenadas (mtodo
de enseanza, asignatura, maestro, sexo, etc.). A menudo,
los efectos de las variables ordenadas suelen analizarse ms a
fondo, a fin de ver si la tendencia es lineal, cuadrtica, cbica o de grado ms elevado [Grant, 1956; Myers, 19591.
64
En la esfera de la persuasin --bastante afn a la de la educacin v la enseanza-, Hovland y sus colegas comprobaron e1{ reiteradas oportunidades, que los efectos a largo
pla~o son no solo cuantitativa sino tambin cu~litati':'amente
diferentes. Estos efectos son mayores que los mm edra tos. en
las actitudes generales, aunque m_s dbiles el? algunas actitudes especficas [Hovland, Lumsdame y Shefheld, 1949]. Las
afirmaciones de una persona desacreditada carecen de ~fect?
persuasivo inmediato, pero ese efecto puede resultar srgnrtlcatvo un mes ms adelante, a menos que se recuerde a. los
interlocutores de qu fuente provienen [Hovland, Jams Y
Kellcv 19 53]. Estos descubrimientos nos alertan contra la
prcd~a de establecer toda nuestra evaluacin experiment~l
de los mtodos pedaggicos sobre la bn~e de postes~s o medlciones inmediatas realizadas en cualquJCr punto arslado del
tiempo.
d
A pesar de los problemas incomparablemente mayo:es e eJecucin implicados (y la incomodidad que ello constituye _pata
el desarrollo del programa de nueve meses de una tes1_s. de
doctorado), nos permitimos recomendar que en la plamflcacin de las investigacones se incluyan perodos de postests de
un mes, seis meses y un ao.
.
.. .
Cuando las mediciones del postest consistan en cahf1cacwnes
y ~untajes de exmenes que de todos modos va_n. a obtenerse,
ese estudio ser un simple problema de contab1hdad (Y mortalidad). Pero cuando sea el experimentador quien intr~d;l;
ca las O casi todos los autores consideran que la repetlcron
de med~iones postest con los mismos alumnos se:a ms
engaosa que el pretest. As se ha comprobado por c1erto en
investigacones sobre memoria [p. ej., ~nderwo~d; 1957_a,].
Al paso que el grupo de Hovland recurna ~ la t1p1ca aplh.:acin de un pretest (diseo 4), ellos organrzaran grupo_s separados experimentales y de control para cada aplazamiento
cronolgico del postest, por ejemplo:
65
R
R
R
R
()
()
X
X
o
o
o
o
Pero ocurre lo contrario si por saber interpretamos la habilidad para seleccionar la correcta clasificacin abstracta del
tratamiento v trasmitir eficazmente la informacin a nuevos
destinatarios~ Con la entrevista grabada hemos repetido cada
vez muchos aspectos especficos carentes de importancia; hasta donde nos fue dado conocer, el efecto pudo haberse creado
por esos detalles y no por las caractersticas que incluimos
adrede. No obstante, si tenemos muchos ejemplos independientes, los detalles especficos sin importancia no sern susceptibles de repeticin en cada caso, y por tanto ser ms
probable que nuestra interpretacin de la causa de los efectos
sea correcta.
Consideremos, por ejemplo, la comparacin de Guetzkow,
Kelly y McKeachie [ 1954] entre los mtodos de enseanza
por disertacin y por discusin. Nuestro conocimiento de
cules fueron los tratamientos experimentales, en el sentido
de poder extraer recomendaciones para otros maestros, es mejor porque se emplearon ocho docentes, cada uno de los cuales interpret cada mtodo a su manera, en vez de utilizar
uno solo, o de hacer que los ocho memorizasen detalles comunes no incluidos en la descripcin abstracta de los procedimientos comparados. (Como en Guetzkow y otros [1954],
esa ejecucin heterognea de X debera complementarse, de ser
posible, con la prctica de que cada tratamiento lo ejecutara ca
da uno de los participantes en el experimento, para que ningn
elemento especfico sin importancia se confundiera con un
tratamiento especfico. A fin de poder estimar la significacin
de la interaccin maestro-mtodo cuando se emplean cursos
intactos, convendra que cada maestro aplicara dos veces cada
mtodo.)
En un ejemplo ms sencillo, un estudio del efecto del sexo del
docente sobre los primeros pasos de instruccin aritmtica
debera utilizar no uno solo, sino muchos ejemplos de cada
sexo. Aunque esta es una precaucin obvia, no siempre se
la ha respetado, como lo seala Hammond [ 19 54]. El problema constituye un aspecto de la insistencia de Brunswik
[1956] en el diseo representativo. Underwood [1957b,
pgs. 281-87] ha sostenido, sobre fundamentos similares, una
posicin contraria a la estandarizacin o rplica exacta de los
aparatos utilizados en los distintos estudios, de manera compatible con su vigoroso operacionalismo.
67
En cualquier experimento la X real es un complicado conjunte~ ~e lo qne. eventualmente se habr de conceptualizar como
c~ls~ultas vanables. Una vez detectado un efecto fuerte y defmKio, el curso del proceso cientfico exige que se realicen
nuevos experimentos q~1e refinen la
destacando bien los
aspectos n1<s esenciales al efecto. Ese refinamiento se loarar por medio de tratamientos definidos y presentados en forma ms panicular y concreta, o bien organizando nuevos
grupos de control, que igualen al grupo experimental en un
nmero cada vez mayor de aspectos del tratamiento reduciendo
diferencias a caractersticas ms especfica; de la
compleja X original. El grupo de control falso y el de control
con operacin simulada que se utilizan en la investi<>acin mdica son ejemplos de ello. Los experimentos anterio;es demostraron un efecto internamente vlido, pero que, no obstante,
pudo haberse debido a que el paciente saba que se lo someta
al tratamiento, o bien al shock quirrgico, y no a las propiedades especficas de la droga o a la remocin del tejido cerebral: de ah la introduccin de los con troles especiales
para prever esas posibilidades. La generalizacin a otras X es
un proceso exploratorio de extrapolaciones sugeridas por la
teo~a, pero sujetas a la experiencia, en cuyo transcurso es
pos1ble que el mencionado refinamiento de X represente un
importante papel.
Generalizctcin a otras O
As: como una X dada arrastra un bagaje de caracteres especficos te6ricamente sin importancia, pero que pueden resultar
los causantes del efecto, as tambin cualquier O dada, cualquier instrumento de medicin, es un complejo en el cual el
contenido correspondiente est necesariamente inserto en una
situacin instrumental concreta, cuyos detalles son marginales
a la finalidad terica. As, cuando utilizamos lpices y planillas de respuesta con calificacin mecnica IBM solemos ha~erlo. por razones de conveniencia y no porque queramos
mclmr en nuestros puntajes la variancia debida a la habilidad
los empleados, la familiaridad con el formulario del test
la exactitud en la observancia de las instrucciones, ete. Asi~
mismo, nuestro examen de la competencia especifica en un
68
tema objeto de investigacin por medio de pruebas consistentes en la redaccin de ensayos habr de efectuarse empleando
como vehculos la habilidad literaria y el uso del vocabulario
y, por lo tanto, deber contener la variancia debida a esas
fuentes que, con frecuencia, no son importantes para nuestros
fines. Dada esa complejidad inherente a cualquier O, nos
encontramos con un problema cuando queremos generalizar
los resultados a otras O posibles. A qu aspecto de nuestra
O experimental se debi aquel efecto internamente v:lido?
Como la finalidad de la enseanza no es solo la de preparar
individuos para futuros exmenes de ensayo y objetivos,
debe tomarse siempre en cuenta ese problema de la validez
externa o la posibilidad de generalizacin.
Una vez ms, desde el punto de vista conceptual, la solucin
no est en confiar a ciegas en que se tendrn mediciones
puras sin complejidades carentes de importancia, sino ms
bien en utilizar medidas mltiples en las cuales los medios y
detalles especficos sin importancia sean todo lo diferentes
que sea posible, al paso que el contenido comn que nos
preocupa est presente en todos y cada uno de ellos. Dentro
de un experimento aislado, es ms lo que puede hacerse en
este sentido por las O que por las X, pues en un solo experimento se pueden lograr muchas mediciones de efecto (es
decir, variables dependientes). En el estudio
Guetzkow,
Kelly y McKeachie [ 1954], se notaron efectos no solo en los
exmenes regulares de curso y en pruebas
de actitud introducidas a este fin, sino tambin en comportamientos ulteriores, como la eleccin de carrera y la inscripcin en
cursos superiores sobre el mismo tema. (Aquellos comportamientos resultaron de igual sensibilidad a las diferencias de
tratamiento que las mediciones del test.) Las O mltiples
deberan ser un requisito ortodoxo en cualquier estudio sobre
mtodos de e;zseanza. En el plano ms simple, deberan aplicarse tanto exmenes objetivos como de ensayo [vanse Stanley y Beeman, 1956], junto con ndices de participacin en
clase, etc. (Una extensin de esta perspectiva a la cuestin
de la validez de los tests se hallar en Campbell y Fiske
[1959] y Campbell [1960].)
69
5. Diseos cuasiexperimentales 1
acogerse a la prctica de mtodos de investigacin ms informales todava. Adems, esta larga lista de fuentes
invali~acin podra, con mayor probabilidad an, reducir la voluntad
de realizar los diseos cuasiexperimentales en que se advierta
desde un primer momento que se carece de pleno control experimental. Este resultado seria la anttesis de lo que nos habamos propuesto.
pesde el punto de vista de su interpretacin definitiva y del
mtento de adaptarlo al proceso evolutivo de la ciencia, todo
experimento es imperfecto. Lo que puede lograr una lista de
verificacin de criterios de validez es qu.e el experimentador
tenga ms conciencia de las imperfecciones residuales que implica su diseo, para poder determinar en los puntos pertinentes las distintas interpretaciones de sus datos. Por supuesto que debera disear el mejor experimento que la situacin
permitiera, y buscar con el mayor empeo los laboratorios
artificinles y naturales que ofrecieran las mejores oportunidades de control. Pero, adems de todo ello, tendra que seguir experimentando e interpretando con plena conciencia de
los puntos donde los resultados son an equvocos. Esa conc~encia es importante en los experimentos en que se ha ejercttado un control total, pero es imprescindible en los diseos cuasiexperimentales.
En persecucin de ese objetivo general, researemos a esta
altura de nuestra obra las ventajas e inconvenientes de un conjunto heterogneo de diseos cuaslexperimentales, cada uno de
los cuales merece utilizarse all donde no haJ'a otros mejores
susceptible.> de que se los aplique. Veremos primero tres diseos experimentales unigrupales. Despus, cinco tipos generales de experimentos multigtc1pales. Una seccin aparte se
ocupar de la correlacin, los diseos ex post facto, los estuen panel y otros temas anlogos.
b teora de la experimentacin
nos cuasJexpenmentales para su aplicacin en situaciones sociales natmales>> en D. T. Campbell, Experimentng, validatng, knozL'ng: problems of mcthod m tbe social scie1/ces, 1\ueva York: McGraw-Hill
en preparacin.
70
71
ht
73
espe~ial s se o:msideran todas las teoras que abarcan circunstanCias cor_npieas. Sin embargo, en la prctica se dispone de
que hagan frente a las bien
pocas te.ortas -cuando las
e~tableCJdas. o a las que han sido verificadas a fondo mediante compltcacl?s e~pcriment:)s; tampoco se proponen seriam~nte es~s . teonas nvales. D1cha escasez es el equivalente
eptstemologJCo de la a~irmacin positiva de la teora que parec~n ofrecer los expenmentos espectaculares. Una escasez seI~eante de hiptesis rivales se da en el conocimiento fenomn.tcamente pc:s~tjvo que por co!1traste parece ofrecer, por
ee~plo~ 1~ vtst~m a la comparativa ambigednd de la exploraclOn tactJ a ciegas.
Dentro de esta perspectiva, la lista de fuentes de invalidacin
que controlan los diseos experimentales puede considerarse
c~m1o una enu~~rac~n de hiptesis -a menudo aceptables~
r;vales de la htpotesis de que la variable experimental ha surtido un efecto. Donde un disefio experimental <~controla>~ uno
~e esos factores, se lmi~a a hacer insostenible esta hip6tesis
rlVal~ aun cu_an_do, en vutud tal vez de complicadas coincidencias, conttm~e ,op~ran?o para producir el resultado experimental. L_as <:hlpotests rtvales aceptables que han requerido
el uso tutlnano de grupos especiales de control actan a modo
de leyes ~mpricas bien establecidas: por ejemplo, los efectos
d~ 1~ practica par~ ~1. agregado de un grupo de control al
dtseno 2,_ 1~ s~Igesttbi!Idad para el falso grupo de control, el
shock_ q;mu_rgi~o para el control con operacin simulada, etc.
l,a~ h1potes1s nvales son crebles en la medida en que pueda
atnbt:ttseles categora de leyes empricas. Cuando en un cuasiexpenmento se carece de controles, al interpretar los resultados hay que considerar bien la posibilidad de que tales resulta~o~ obedezcan a factores no tomados en cuenta. Cuanto
ma: Improbable sea esta posibilidad, ms vlido ser el experimento.
Como lo sealamos al, exponer el di~eo de cuatro grupos
de Solomon, cuanto mas numerosas e Independientes sean las
formas en que se demuestra el efecto experimental, menos nu~nero~as y probables se tornan todas las dems hiptesis rivales
mval1?antes. S~ apela entonces a la economa. La validez del
expenmento viene a ser, pues, la de la admisibilidad relativa de
las teoras rivales: la teora de que X tuvo un efecto frente a
las teoras de causacin que comprenden los factores no cont~olados; Si cabe explicar la totalidad de varios conjuntos de
d1ferenCJas por la hiptesis nica de que X tiene un efecto
al paso que es necesario hipotetizar varios efectos separado~
de variables no controladas, una para cada diferencia observada, entonces el efecto de X viene a ser el ms defendible.
Es frecuente recurrir a este modo de inferencia cuando los
cientficos tienen que limitarse a resumir literatura por carecer
de experimentos petfectmente controlados. As, Watson
[ 1959, pg. 296] hall confirmatoria la evidencia de los efectos nocivos de la privacin materna, porque se la ve confirmada por una ampla variedad de datos, cuyas insuficiencias
especficas varan de <J.l1os estudios a otros. A su vez, Glickman
[ 1961], a pesar de la presencia de hiptesis rivales sostenibles
en cada uno de los estudios, consider importantes las pruebas de un proceso de consolidacin slo porgue la hiptesis
rival sostenible variaba de un estudio a otro. Esta forma de
induccin lgica, adoptada por lo comn en la combinacin de
inferencias de distintos estudios, se introduce deliberadamente dentro de ciertos diseos cuasiexperimentales, en especial
los remendados, como el 15.
El recurrir a la economa no se justifica desde el punto de
vista deductivo, sino que constituye ms bien un supuesto
general acerca ele la naturaleza del mundo, que fundamenta
casi toda aplicacin de la teora en la ciencia, por ms que
en aplicaciones particulares resulte a menudo errnea. En relacin con esta observacin hay otro argumento de admisibilidad,
que invocaremos acaso ms en detalle a propsito del muy
utilizado diseo 1O (un buen diseo cuasiexperimental, que
a menudo se confunde con el verdadero diseo 4). Es la presuncin de que, en casos de ignorancia, el efecto principal
de una variable debe juzgarse ms probable que la interaccin
de otras dos variables; o que, en general, los efectos principales son ms probables que las interacciones. En su mxima
expresin, cabe sealar que si cada interaccin de orden superior es significativa y cada efecto es especfico de determinados valores en todas las dems dimensiones posibles de tratamiento, ya no hay lugar para la ciencia. Si podemos generalizar alguna vez, es porque podemos hacer caso omiso de
un gran cmulo de factores potenciales determinantes.
Esto fue denominado por Underwood [1957b, p>g. 6] Supuesto de causacin finita. En otro lugar [ 1954], el mismo
autor ha registrado la frecuencia de efectos principales y
de interacciones en el Journal of Experimental Psychology,
confirmando la relativa escasez de interacciones significativas
(aunque las correcciones introducidas por el editor, tendientes
a presentar resultados claros, nos hacen dudar de este hallazgo).
74
75
En los p<rrafos siguientes expondremos primero los experimentos con un solo grupo. Desde 1920, por lo menos, el diseo experimental predominante en psicologa y educacin
ha sido el de grupo de colltrol, como el 4, 6 o, acaso ms
a menudo an, el disci'o 1O, que veremos ms adelante. En
bs ciencias sociales, y considerando situaciones sobre el terreno, los diseos de grupo de conaol han predominado a
tal pnnto que par<1 ;llgunos son sinnimo de experimentaci6n. A consent.ctKia de ello llltlchos investigadores llegan
a abandonar todo intento <k ex pcri m en taci(lll en si tnaciones
en las cuales no se disponga de grupos de cotJtrol, terminando
as como una imprecisitn itllll'LTS:Jria. Fn realidad, varios diseos cnasiexperimentaks aplicthlcs a grupos aislados podran
emplearse provechosamente, y segttir los dnones lgicos e interpretativos experimentales, en muchos casos en que es imposible el discio con grupo de control. La coopcr<Kin y la
posibilidad de cxpcriment:H se dan a menudo en unidades administrativas naturales: una lll:tcstra dispone de su clase; el
director de una escuel:t secuntbria tal vez est dispuesto a
realizar encuestas peridic1s sohre el cst:1do de nimo de los
alumnos, etc. En tales situaciones el tratamiento diferencial
de segmentos dentro de la unidad administt'<ltiva (requerido
para el experimento con grupo de control) qu.iz< resulte imposible en sentido administrativo o, aun cuando ello no ocurra, sea indeseable como experimento a causa de los efectos
re:JCtivos ele los dispositivos. P:1ra situaciones de esta ndole
bien podr:m <Jdoptarse experimentos con un grupo n!co.
:e
?4
Este diseo experimental tipific gran parte de la experimentacin clsica del sfglo X!X en Jas ciencias fsicas y biolgicas. Por ejemplo, si una barra de hierro cuyo peso no ha va
7(.,
77
X
_____,___ _._.. A
78
ctuzsicxwrint rnl,al r! s:
1. Series
cronolgicas
o o () oxo o o o
8. Discfio de
Jnlwstras
cnmol{)glcas
('(jnival~'lJtcs
1-
mtt('c.trns
mat<"rial<s
eqniv~J<'ntcs
M.x,o M,,x,,o
MaX,O
A'rXIIO, t>h.
10. Dscio de
grupo de
control
+ +
no <quivalente
()
+ +
comptttsa(II)S
_x,o x,o
12.
muestra
separada
pretE'st-postest
RO (X)
R
X O
RO (X)
R
R
R
R 0
X O
O (X)
X O
81
to de X Si el procedimiento de medicin implica las apreciaclones de observadores Jmmnnos conocedores del plan expenmcntal, puede producnse una sendoconfirm,tcn de b hia causa de las expectativ;s del observador. As, el
cambio ~xpermental de poner en posesin de su cargo a. un
nuevo ,hrector puede producir una variacin en las estadstiGIS de faltas disciplinari,!s, en vez de influir sobre la tasa de
infracciones como tal. A menudo puede empicarse el diseilo
7 p,tra medie los efectos de un imporunte cambio introducido
en la poltica administrativa. Teniendo esto en cuenta, convendra evitar el cambio de instrumentos de medicin a la
vez que se modifica la politca. En la mayor parte de los casos
sera preferible, a fin dt: prcserv,\r la interpretahlidad de un;J
seri.e cronolgica, continuar empleando dispositivos un t~mto
antlcu;Jdos, en vez de sustituirlo,; por otrus mt1s modernos
pero distintos.
Los efectos de la tef!,tC!l suelen consistir en un, funcin
negativamente acelerada del tiempo trascurrido, razn por
la cual no son aceptables como explicaciones de un efecto en
Or. mayor que los efectos en o~, 0:1 y 01. La sclcccir)n como
fuente de efectos principales se elimina tanto en este diseo
como en el 2, si en todas las O estn implicadas las mismas
personas. S en un determinado grupo los datos se recopilan
sobre la base de sus integrantes individuales, se puede eliminar la mortalidad en ese experimento lo mismo que en el
diseo 2. No obs1ante, s las observ;tciones se refieren a datos
colectivos, h,lhra que llewr un registro del ausentsmo, las
renuncias y las reposiciones, a fin de asegurarse de que las
coincidencas de cambios de
no ofrezcan hipctesis rivales aceptables.
,
En cuanto a la V<lidez externa, est claro que el dccto experimental bien podra ser especfico para las poblaciones SL;jetas a reiteracin de pruebas. Es improbable qLic ello constituya una limitacin a la investigacin sobre la ense1anza en
establecimientos escolares, a menos que d experimento se
realice con O artificiales no comunes en la situacin escoLu
habitual. Aderws, este diseo es de particular ap]icaci6n en las
situaciones in.stitucionales en que se llevan r~gistros regulares que consutuyen, por tanto, parte natural del ambiente en
que se realiza el experimento. Las pr~1cbas anuales de calificacin en las escuelas pblicas, los registros de enfermedad,
etc., no son por lo comn reactivos, puesto que son tpicos
del universo :d cual se quiere hacer ]a generalizacin. La interaccin seleccin-X se refiere a la restriccin de los efectos
82
83
84
85
un espaciamiento temporal constante, sobre todo cuando pueden introducir un elemento de confusin con un ciclo diario,
semanal o mensual, o cuando a causa de la periodicidad predecible, un condicionamienl(J indeseable al intervalo temporal puede intensificar la diferencia entre las distintas presentaciones. As, Sorokin se asegur6 de que cada tratamiento experiment:d se reali:~.ara con idntica frecuencia de maana y
de t<lrde.
Casi todos los experimentos con este disco han empleado en
proporcin poc1s repeticiones de c1da concliciLn Lxperimental,
pero una extensin dL: In teora 1kl muestreo como h representada por Brunswik L19561 Sl'll<da la necesidad de grandes
Tnitl"SllTOs :dL'ntorios, rL:prcsentativos v equivnlcntes, de los perodos. Kerr [ 19-15 J es ljiJicn lll<s se ha apro:ximado ul w~: a
este idL<d en sns cxpcrillll'lllilS :ll'l"IT:l del itd~l11jo de b mscl sohre el rendimiento industrial. Cada uno de ellos comprendi un solo grupo c:xpcriment:d con una llll!Cstra alcatori:~.:ld:l y equivalente de d:1s a lo largo de varios meses. De
esta forma, en un experimento pudo comparar 56 das con
msica y 51 das sin ella, y en otro tres tipos diferentes de
msica, representada cada una por muestras equivalentes de
14 das.
Tal como lo emple Kerr, por ejemplo, el diseo 8 parece
en general internamente vlido. La historia, qu.e es el principal
inconveniente del experimento con series cronolgicas, se controla presentando X en numerosas sesiones separadas, haciendo as improbable en extremo cualquier otra explicacin
fundada en la coincidencia de acontecimientos externos. Las
otras fuentes de invalidacin se controlan con la misma lgica
detallada a propsito del diseo 7. En cuanto a la validez
externa, es evidente que solo cabe extender la generalizacin
a poblaciones probadas con frecuencia. El efecto reactivo de
los dispositivos y la conciencia de que se es objeto de la
experimentacin constituyen una deficiencia ele esta prueba.
Cuando son grupos separados los que reciben las distintas X,
puede ocurrir (sobre todo en el diseo 6) que jgnoren por
completo la existencia del experimento o de los tratamientos qne se comparan. No ocurre ns cuando se maneja un
solo grupo y se lo expone en repetidas sesiones a una u otra
condicin, por ejemplo, a una base de cmputo de pago contm otra en el experimento de Sorokin; una condicin de trabajo contra otra en el de Allport; un tipo de ventilacin contra otro en los esudios de Wyatt, Fraser y Stock [ 1926],
y una clase de msica contra otra en el de Kerr (aunque es re
86
87
89
ca entre las medias con datos correlacionados. Esta es la lgica de los anlisis de Allport y Sorokin, aunque en realidad
no se utilizaron tests de significacin. Pero cuando solo estn
implicadas una o dos repeticiones de cada condicin experimental, los errores de muestreo de las sesiones pueden ser
muy grandes o el control de la historia muy deficiente. Los
errores aleatorios en el muestreo de sesiones podran constituir lo que a la luz de este anlisis parecen ser diferencias
significativas entre unos y otros tratamientos. Esto ser un
error muy grave si el efecto de las sesiones es significativo
y apreciable. Sobre ese supuesw lgico se podra obtener, por
ejemplo, una diferencia sumamente significativa entre X 1 y
X:;, cuando cada una solo haya sido presentada una vez y cuando c11 una sesitn ;dgn acontecimiento externo haya producido
por azar un resultado nouhlc. Parece, pues, imprescindihle
que para c:Hia tratamiento se incluyam> por lo menos dos sesiones y estn representados los grados de lihertad entre ellas.
La mejor forma de cumplir con este requisito es, quiz, prohar ante todo la diferencia <:ntre bs medias de tratamiento y
un trmino de error entre las diversas sesiones y con respecto a cada tratamiento. Despus de establecer as la significacin del efecto del tratamiento, se podra proceder a determinar la proporcin de sujetos para los cuales se verifica,
obteniendo as datos sobre la posibilid,ld de generalizar el ef~c
to a diwrsas personas. Las mediciones y muestreos repetidos
de sesiones plantean muchos problemas estadsticos, algunos
de los cuales no han sido resueltos todava [ Collier, 1960;
Cnx, 1951; Kempthorne, 1952].
90
91
92
93
o
o
Dos cosas han de tenerse clars sobre este diseo. Ante todo,
que no se lo debe confundir con el 4, el diseo con grupo
de control pretest-postest, donde los sujetos experimentales
que se toman de una poblacin comn se asignan en forma
aleatoria al grupo experimental y de control. En segundo
lugar, que, a pesar de ello, hay que admitir que el_disc? 10
es utilizable en muchas oportunidades en que son tmposrbles
los diseos 4, 5 o 6. Sobre todo, habn1 que reconocer que
aun el agregado de un grupo de control no equiparado o ~o
equivalente reduce en gran parte la ambigedad de las mterpretaciones que derivan del diseo 2 de un grupo. pretestpostest. Cuanto ms similares sean en sn reclutamiento el
grupo experimer:tal y ~1 de control y m,s se confirme esa
similitud por los pnntaes del pretest, mas ehcaz resulta ese
control. Suponiendo que estos ideales se aproximen a los
objetivos de la validez interna, .podemos con~idcr~r que el
diseo controla Jos principales electos de la hrstona, la maduracin, la administracin de tests y la instrumcntac 11,
donde la diferencia para el grupo experimental entre el pretest y el pos test (si fuera mayor que para el grupo de control) no puede explicarse por efectos princpales de ~sas variables, como los que afectaran tanto al grupo expemnental
como al ele control. (Sin embargo, deben extremarse las precauciones sobre la historia intrasesional mencionadas en el
diseo 4.)
Un esfuerzo por explicar una ganancia pretest-postest propia
del grupo experimental en trminos de factor~s externos, como
hisroria, maduracin o aplicacin
tests, ttene que suponer
una interaccin entre esas variables y las diferencias especficas de seleccin que se den entre el grupo experimental y
el de control. Aunque tales interacciones son en general poco
probables, hay un cierto nmero de situaciones en las que
podran invocarse. Acaso las ms comunes sean las interacciones que implican maduracin. Si el grupo experimental
consta de pacientes de psicoterapia y el de control de alguna
otra poblacin disponible a la cual se le hayan administrado
un test y un retest, una ganancia peculiar al grupo experimental bien podra interpretarse como un proceso espontneo
de remisin tpico de grupo tan extremo, ganancia que se hubiese producido tambin aun en ausencia de X. Tal interaccin entre seleccin y maduracin (o seleccin-historia, o seleccin-test) podra confundirse con e1 efecto de X, constituyendo por tanto una amenaza a la validez interna del experimento. Esta posibilidad ha sido representach -::n la octava
94
96
97
98
99
1 J. Diseos compensados
Bajo este ttulo se renen todos aquellos disei'os en los cua
les se logra el control experimental o se aumenta la precisin
aplicando a todos los participantes (o situaciones) la totalidad
de los tratamientos. Esos dsefos recibieron las denominaciones de experimentos rotativos>~
19 23], -di.
scfos compensados
cj.,
1949], llsefos
cru:;:ados [Cochran y
19.58] y diseos
de connnJI<>~in
.
dispositivo de cua~
drado
es
utiliza en .la compensacin.
en el
11, esquema
Ese cuadrado
tb:ado
en el
y por turno a
ncra natural o incluso a cuatro
1958]:
Primera
Tercera
Cuarta
ve,z
vez
X::C)
Grupo B
x,o
vez
vez
X10
~-~-
Grupo C
x,o
-x~o
D
El disciio ha
slo con postests, d,ldo que
presta particular
donde los pretcsts resultan
inapropiados y no se dispone de
como el 10. El
dse1o contiene tres clasificaciones (grupos, sesiones y X
o tr<ltamentos experimentales).
clasificacin es Orto-
x1
t10
t:;O
t~O
(()
x~
t~O
t10
t()
[;0
X:~
x1
t.10
t10
[()
t40
t20
t30
t~O
ttO
Resultan as comparables las sumas de puntajes por X, al tener representados, en cada una de ellas, cada oportunidad y
grupo. Las diferencias en tales sumas no se podran interpretar como resultados artificiales de las discrepancias grupales
iniciales o de efectos de la prctica, la historia, etc. De parecida comparabilidad son las sumas de las filas para diferencias grupales intrnsecas, y las sumas de las columnas de la
primera presentacin para las diferencias en las sesiones. Desde el punto de vista del anlisis de variancia, el diseo parece
suministrar as informacin acerca de tres efectos principales
con el nmero de casilleros que suelen exigirse para dos. Resulta evidente el costo de esta mayor eficacia: lo que parece
ser un efecto principal significativo segn cualquiera de los
tres criterios de clasificacin, acaso constituye en cambio una
compleja interaccin significativa entre los otros dos [Lindquist, 1953, pgs. 258-64]. Las diferencias aparentes entre
los efectos de las X podran resultar un complejo efecto especfico de interaccin entre las diferencias grupales y las
sesiones. Las inferencias sobre los efectos de X dependern
de la admisibilidad de esta hiptesis rival, y por lo tanto las
estudiaremos en forma ms detallada.
Digamos, en primer lugar, que la hiptesis de tal interaccin
es ms admisible para la aplicacin cuasiexperimentill descrita,
que para las de los cuadrados latinos en los experimentos
propiamente dichos mencionados en los textos. En lo que
se ha denominado la dimensin grupal, se entremezclan dos
posibles fuentes de efectos sistemticos. Ante todo, estn los
factores de seleccin sistemtica implicados en la formacin
natural de los grupos. Cabe esperar que esos factores tengan
a la vez efectos principales e interacten con la historia, la
lOO
101
en nmero suficiente, haran del cuasiexperimento un experimento propiamente dicho. Es probable que implicasen tambin cantidades suficientes de grupos para posibilitar la asignacin aleatoria de grupos intactos a los tratamientos, medio
de control que por lo comn es preferible. No obstante, careciendo de tales posibilidades, un cuadrado latino nico cons"
tituyt: un diseo cn~1siexperimental intuitivamente satisfactorio, a causa de su demostraci(m de todos los efectos en la
totalidad de los grupos de comparacin. flttn reconociendo
los posibles errores de interprct;JCin, constituye un discf'o
qul' bien vale la pena adoptar cuando no hay posibilidades de 1111 control 1ms eficaz. lJna vez desLK:Hh's sus graves
inctlnvcnientl's, cx:1mincmos sus ventajas relativas.
Como todos los cuasiexperimcntos, gana este en pujanza con
la congruencia de las repeticiones intert1:1s de la prucba. Para
poner de relieve esa collgrucncia, deben eliminarse los efectos
principales de las sesiones y los grupos, expresando cacla
casillero como un desvo respecto de las mcdi,s de filas (gntpo) y columnas (momentos): M 11 ,-M,,.-M.,+M ... Despus se reordenan los datos, con los tratamientos (X) enea"
bezando las columnas. Supongamos que el cuadro que ohte"
nemos es de una satisfactoria congruencia, que el ms eficaz ele
los tratamientos es el mismo en los cuatro grupos, etc. Cules
son las probabilidades de que eso no sea un efecto rc<1l de los
tratamic:ntos, 'ino una interaccin de grupos y sesiones? Podemos observar que casi todas las posibles interacciones de
grupos y sesiones reducirLm o enturbiaran el efecto maOiificsto de X. Una interaccin que imitara un efecto principal
de X sera poco probable, y lo sera menos an en cuadrados
latinos mavores.
Nos sentirmnos muy atrados por este diseo cuando tuvisemos control de programacin sobre unos cuantos grupos de
formacin natural, como por ejemplo clasc:s, pero no nos fuese posible subdividir esos grupos naturales en subgrupos de
equivalencia aleatoria, sea para una presentacin de X o para
aplicar tests. En tal situacin, si hubiera cmo aplicar un
pretest, se dispondra asimismo del diseo 10: tambin im"
plica una posible confusin de los efectos de X con interacciones de seleccin y sesiones. Se juzga que esta posibilidad
es menos probable en el diseo compensado, porque en caJa
grupo se demuestran todas las comparaciones y por lo tanto
se necesitaran varias interacciones equiparadas a fin de imL
tar el efecto experimental.
Mientras que en los otros diseos la especial sensibilidad de
102
RO (X)
X O
En este esquema, las filas constituyen subgrupos de equivalencia aleatoria, representando la X entre parntesis una presentacin de X sin importancia. Se mide una muestra antes de X, otra equivalente despus de X. El diseo no es intrnsecamente eficaz, como lo indica su fila en el cuadro 2.
No obstante, suele resultar viable, y a menudo merece que
se lo aplique. Se lo ha utilizado en experimentos de ciencias
sociales que son an los mejores estudios existentes en sus
temas especficos [p. ej., Star y Hughes, 1950J. Aunque se
lo ha denominado diseo simulado antes-y-despus [ Selltiz,
Jahoda, Deutsch y Cook, 1959, pg. 116], vale la pena destacar su superioridad respecto del diseo comn antes-y-des"
pus, el diseo 2, por su control tanto del efecto principal de
la aplicacin de tests como de la interaccin de la adminis"
tracin de tests con X. El defecto fundamental del diseo es
que no puede controlar la historia. As, en el estudio de la
campaa de publicidad realizado en Cincinnati para las Na-
103
ciones Unidas y la UNESCO [Star y Hughes, 1950], es probable que hechos externos de la escena internacional lmbieran sido la causa de la reduccin observada en el optimismo
sobre la coexistencia pacfica con Rusia.
Est<l obra aspira a estimular los dsefos (<de retazos, en los
cuales se agregan aspectos que permitan controlar factores
especficos, de ordinario uno por vez (en contraste con los
experimentos propiamente dichos, <Je mayor elegancia, en que
con un solo grupo se controlan todas las amenazas a la validez
interna). Repitiendo el diseo 12 en diferentes situaciones y
momentos, como en el diseo l2a (vase cuadro 2, xg. 80),
se controla la historia, pues si el mismo efecto se da en varas
ocasiones, la posibilidad de qne sea tesult:Hlo de acontecimien
tos hist6ricos coincidentes se torna menos probable. No obsbant(~, las tendencias histricas persistentes o los ciclos estacionales siguen constituyendo explicaciones rivales no controladas. Por la repeticin del efecto en otras condiciones, cabe
reducir la posibilidad de que el
observado sea caracte-J'stico
la nica poblacin seleccionada en el primer momento. No obstante, s la situacin
la investigacin permite
utilizar el diseo 12a, tambin ser vinble el 13, que en genemlte:mltar preferible.
Es poco probable que se invoque la maduracin, o el
to del envejecimiento de los participantes, como explicacin
rival, ni aun en estudios sobre la opinin pblica que se extiendan durante meses. Pero en la encuesta por muestreo, y
hasta en ciertos cursos universitarios, las muestras son suficientemente grandes y las edades lo bastante heterogneas para que se puedan comparar las submuestras del grupo pretest
que difieren en maduracin (edad, nmero de semestres cutetc.). La maduracin, y la acaso ms peligrosa posibilidad
tendencias persistentes y estacionales, tambin es controlable por un diseo como el 1
que agrega un grupo pretest anterior, aproximando el diseo al de series cronolgicas,
aunque sin la aplicacin reiterada de tests. Para poblaciones
como la de pacientes a quienes se aplican tratamientos de
cotempia, donde podra darse una mejora espontnea o curacin, los supuestos de linealidad implicados en forma implcita en este control quiz no fueran aceptables. Es ms prohable que la tendencia de maduracin reciba una aceleracin
negativa, haciendo as que la ganancia de maduracin 01 o~
sea mayor que la de 02- 0:;, en detrimento, por tanto, de la
interpretacin de que X ha producido efecto.
La instrumentacin constituye un riesgo en este diseo, cuan-
104
105
o:J
106
RO (X)
R
RO
R
X O
"
"
-~
o () o () o o
108
fii ;:;;
~v
-~
i5"
"6
"
:~
;':;
M
'"
:o"
o
"'
:Q
'E
" ;::;
'V
:n
Di.vntos
(cm d.
mr:11lafr.1.'
]3. ])i.<;<fo df
:-wr)arada
HHl\'>ha
pret"st-);>slist
con .t;rnpo de
contrqJ
JI O (X)
ll
X O
no
]{
"" ro
(X
Este disdio contiene (en las O que comprenden a X) el mmero 10, de grupo de control no equivalente, pero gana
certidumbre de interpretacin por las mltiples mediciones representadas, ya que en cierto sentido el efecto experimental se
demuestra dos veces, respecto del control y respecto de los
valores pre-X en su propia serie, como en el diseo 7.
ms, !u interaccin entre seleccin y maduracin se controla
en el sentido de que, si el grupo experimental demostr por
lo comn una mayor tasa de ganancia, aparecera as en las
O pre-X. En los cuadros 2 y 3 es escasa la representacin de
esta nueva ganancia, pero aparece en la ce lumna final de validez interna, titulada <nteraccin de seleccin y maduracin. Puesto que la maduracin se controla tanto en la serie
experimental como en la de control, por las razones expuestas en nuestra primera presentacin del diseo 7 de serie
cronolgica, la diferencia en la seleccin de
grupos, q;ze
opera juntamente con la maduracin, instrumentacin o re~
grcsin, difcilmente podr explicar un efecto notorio. Sin
embargo, no se excluye la posibilidad de una interaccin entre la diferencia de seleccin y la historia.
Como con el diseo 7 de serie cronolgica, se ha puesto un
signo negativo en la columna de validez externa para la m-
.m
"' aa
;;; 'O"m
o o o oxo ()o o
()1.()
Ti
l {:::;: "
rw
(X)
ii o
(X)
R'
o
o
}{()
o
+
-o~
i5.
o oxo o
()
o o
1-
()
-~
))i~wo de ciclo
institucional
CJ. A X o,
C. llO" X O,
J;
_X 0'--~
(;I._B"H
eJ. e
~"~
Gen. Pol>.
p/Cl. IJ 0,;
Con t. Gen. Pob.
p/CI. e o,
c;;;;i.
<O, } +
<Oa
o" <O.to"
o,
Oc
o". O;:o
()"
-1
Oc. <"O.J
-+-
+
+-
+
+
?
1 5.
un
n:currente:
retazos
disc'o l '5
investigacwn de
campo en la Cital ':e comkn:rt
insuficiente v se
van s!lmando luego
de {vcsu otra dt: las fuentes recurrentes de
rcstJltmln LoS a menudo una burda acumulacin
vcrificJcioque
la simdda intrnseca de los
dichos,
parte de
ofrece, y
las posibles
Otro aspeccl cfect'J
110
llJ
X 01
Clase B
Este diseo combina los enfoques longicudinab y de corte
trasversal que suelen emplearse en la investigaci6n del desarrollu. En esta se supone que la comparacin es tal, que pueden
medirse a la vez un grupo expuesto a X y otro que va a serlo;
esta comparacin entre 01 y 0:! corresponde as al diseo 3,
Comparacin de grupos estticos. La segunda mcdici6n del
personal de la Cbse B, un ciclo despus, nos da el segmento
de diseo 2, Pretest-postest de un grupo. En el cuadro,
txg. 109, las dos primcr<ls filas referentes al diseo 15 muestran un nn:lisis de esas comparaciones. La comparacin cruo~ su mi 11 stra diferencias que no podran explizada de () 1
carse por los efectos de la historia o por el test-retest, sino
que podrLm deberse a diferencias en el reclutamiento de un
a fo a otro (como se indica por medio del signo negativo en
Seleccin) o a la circunstancia de que los participantes eran
un ao mayores (signo negativo en Maduracin). Cuando
todas las pruebas se realizan durante el mismo perodo, parece improbable que haya una variable entremezclada de instrumentacin o desvos en la ndole del instrumento de medicin.
En la tpica comparacin de las diferencias de actitud entre
alumnos universitarios de primero y segundo ao, el efecto de
la mortalidad no pasa de ser una explicacin rival: ol y 02 podran diferir solo a causa del tipo de personas que han abandonado sus estudios en la Clase A, pero contina teniendo
representacin en la B. Este inconveniente se puede evitar si
las reacciones se identifican por individuos y el experimentador espera antes de analizar sus datos a que la Clase B haya
112
01
>
02, 02
< 03
02
< 0.1.
Ntese, sin embargo, que 0:; apar~ce en l~s tres, tazo?- por la
cual todo ello podra parecer confl~matorlO so!o en vut~d de
una actuacin excntrica del menc10nado conunto particular
de mediciones. La introduccin de 05, o sea la Clase C, probada en ocasin del segundo test antes de ser expuesta a X,
ofrece una nueva medicin pre-X que puede compararse con
0,1 y 0 1 , etc., brindando una redundancia necesaria. La divi-
113
114
115
Los requisitos formales de este diseo parecen aplicables incl_u_so a un problema como el de la psicoterapia. Esta posiblltdad revela cun difcil es una verificacin correcta de la
variable maduracin. Comoquiera que se elijan los controles
poblacionalcs para una situacin de psicoterapia, si no reciben
este tipo de tratamiento diferirn en aspectos importantes.
Aunque estn tan enfermos como los sometidos a tratamiento psicoteraputco, es casi seguro que diferirn en su conocimiento de l, as como en sus creencias al respecto y su
fe en ese procedimiento curativo. Un grupo de esta ndole,
enfermo pero optimista, podra muy bien tener posibilidades
de recuperacin tpicas de cualquier grupo de comparacin
que pudisemos echar mano y, por consiguiente, podra
m<llinterpretarsc una interaccin de seleccin y maduracin
como un efecto de X.
'
Para el estudio aislado de procesos de desarrollo, el no poder
controlar la maduracin no es, ciertamente, un inconveniente,
ya que ella es el objetivo mismo del anlisis. Esa combinacin de comparaciones longitudinales y de corte trHsversal debera emplearse en forma ms sistemtica en este tipo de estudios. El estudio aislado de cortes trasversales confunde maduracin con seleccin y mortalidad. El estudio longitudinal
confunde maduracin con aplicacin reiterada de tests e historia. Por s solo no es probablemente mejor que el de corte
t~a.sversal, aunque su costo ms elevado le otorga mayor prestJg!O. La combinacin de ambos, quiz con reiteradas comparaciones de cortes trasversales en diversos momentos parece ideal.
'
Tal como se presentan los esquemas del diseo 15, se supone
que se podr aplicar el postest a un grupo al mismo tiempo
que el pretest a otro. No siempre ocurre as en situaciones
en que tal vez se descara utilizar este diseo. La siguiente es
una representacin ms precisa del caso tpico en la situacin
escolar:
Clase A
Clase Bt
Clase Bz
Clase C
Ot
ROz
Oa
01
neidad. No obstante, difcilmente podra aceptarse la explicacin desde el punto de vista de la historia s ambas comparaciones acusaran el efecto, como no fuera postulando una
serie bastante compleja de coincidencias.
N6tese que ninguna tendencia histrica general, como la que
sin duda hallamos en las actitudes sociales, se confunde con
resultados experimentHles concretos. Una tendencia de esa ndole colocara a Oz en posicin intermedia entre 01 y ,
mientras que la hiptesis de que X tiene un efecto exige que
01 y 0:1 sean iguales y o~ difiera de ambas en el mismo sentido. En general, si se repite varias veces el experimento,
es poco probable que la confusin con la historia constituya
un problema, ni siquiera en esta versin del diseo. Pero,
para ciclos institucionales de menos de un ao, habr posibilidad de confusin con variaciones estacionales en actitudes,
moral, optimismo, inteligencia, etc. S lH X es un curso desarrollado solo en la temporHda de otoo,'' y entre setiembre y
enero la gente suele experimentar mayor agresividad y pesimismo a causa de los factores climticos de la estacin, esa
tendencia estacional recurrente se confundir con los efectos
X en todas sus manifestaciones. Para situaciones de esta
ndole pueden utilizarse, y resultan aconsejables, los diseos
10 y 13.
Si las comparaciones de corte trasversal y longitudinales indican efectos anlogos de X, ello sera inexplicable como
interaccin entre la maduracin y las diferencias de seleccin
entre las clases. No obstante, se ha dejado en blanco la columna porque este control no aparece en las presentaciones
ftaamentariHs del cuadro 3. Las calificaciones de los criterios de
validez externa se ajustan en general al esquema de los diseos anteriores que contienen los mismos fragmentos. Los
signos de interrogacin en la columna <nteraccin
seleccin y X, advierten simplemente que los descubrimientos se
limitan al ciclo institucional que se estudie!. Dada la complejidad de X, es posible que se realice la investigacin por
razones prcticas ms que con propsitos tericos, y tal vez
se quiera en este caso generalizar a una institucin en particular.
o.,x
116
117
Desempeo posterior, O
40
JO
20
10
60
70 80 90
1)0 140
150
120
121
Correlacin y causacin
122
123
126
El pretest retrospectivo
En muchas situaciones militares de tiempos de guerra, puede
ocurrir que la asignacin de hombres de igual rango y especializacin a distintas unidades se haga por medio de procesos
caticos, sin consideracin alguna a privilegios, preferencias o
capacidades especiales. Una comparacin entre las actitudes
de blancos que se asignaron a unidades de infantera racialmente mixtas y las de aquellos destinados a otras integradas
solo por blancos puede resultar de inters por sus determinaciones causales [Information and Education Division, 1947].
No podemos, sin duda, hacer caso omiso de estos datos, sino
ms bien buscar informacin complementaria a fin de eliminar hiptesis rivales aceptables, sin perder conciencia de las
dems fuentes de invalidacin. En aquel caso la entrevista
postest, no solo contena informacin sobre las actitudes
corrientes hacia los negros (ms favorables en las compaas mixtas), sino que adems requera que se recordasen las
actitudes anteriores al destino actual. Aquellos pretests retrospectivos no arrojaron diferencia alguna entre ambos grllr
pos, aumentando as la posibilidad de que antes de la asignacin al destino no hubiera existido ninguna disparidad.
Un anlisis parecido result importante en un estudio realizado por Deutsch y Collins [ 19 51] comparando los ocupantes
de un barrio formado por unidades integradas con los que
ocupaban unidades segregadas, en momentos en que la escasez
de viviendas era tal, que caba presumir que la gente haba de
tomar cualquier comodidad disponible, con prescindencia casi
total de sus actitudes. Teniendo tan solo mediciones postest,
podra haberse considerado que las diferencias que descubrieron reflejaban sesgos de seleccin sobre actitudes iniciales.
La interpretacin de que la experiencia integrada provoc las
actitudes ms favorables se vio fortalecida cuando un pretest
retrospectivo indic que no haba diferencias entre los dos tipos de grupos de vivienda en actitudes anteriores que se recordaran. Dados los factores autistas que, segn se sabe distorsionan la memoria y los informes de las entrevistas, tales
datos nunca pueden ser decisivos.
Deseamos intensamente poder trabajar con la entrevista de
127
'O) (XO'
.. (. . . .
\o'
Estudios en panel
. . . ? ... ) ..
128
129
Alumnos
Interesados
No interesados
130
131
Maestros
Fro
Clido
Segunda sesin.
Alumnos
Ir.tcresados
i ~o interesados
Maestros
Fro
Clido
::
Saltan a la vista tanto la posibilidad de error de la informacin cmrelacional ordinaria como el ingenio del anlisis de
Lazarsfdd, si notamos que entre los desplazamientos. q~e habran posibilitado la trasformacin se dan los siguientes
'Jpuestos polares:
La
Maestros
Fro
Clido
Interesados
10
preponderncia del uno sobre el otro. Estos diagramas representan los dos resultados ms claros posibles. De producirse
uno de ellos, el .examen de los sujetos que se desplazan, posibilitado por la recopilacin de datos tipo panel (imposible
s en cada caso actuasen distintos alumnos y maestros), parece otorgar gran admisibilidad a una inferencia causal monodireccionaL Para los que se desplazaron, pueden notarse la
dimensin temporal y el sentido del cambio. De verificarse el
caso indicado en primer trmino, sera poco probable que los
alumnos estuvieran cambiando de maestros, y muy probable
que los maestros estuvieran cambiando de alumnos, al menos
en esos veinte cursos cambiantes.
Aunque los socilogos dejan el anlisis al nivel dicotmico,
estos requisitos pueden formularse de nuevo en forma ms
general, como correlaciones desfasadas en el tiempo, donde el
efecto debera tener una correlacin ms elevada con
una causa anterior que con una <mlterior; es decir,
rx 1 o 3 > rx 2 o 1 Tomando el caso en que los maestros son lns
causantes de la conducta de los alumnos, obtenemos:
Alumnos segunda v.ez
No interesados
Fro
30
Cldo
Interesados
No interesados
Aaestros
Fro
( :lido
Interesados
Interesados
No interesados
No interesados
132
133
134
preferibles a 1.194 no comparables, sobre fundamentos similares a nuestro nfasis relativo a la prioridad de la validez interna sobre la externa. Lo lamentable es que sus 46 casos
tampoco son comparables, y lo que es ms grave todava:
aun admitiendo su defectuosa argumentacin, la reduccin era
innecesaria.
Incurri en una grave subequiparacn por dos razones distintas. Su primera fuente de subequiparacin
que la equiparaci6n est sujeta a regresin diferencial, la que en este caso
producira por cierto una diferencia final en el sentido obtenido (ele b manera inclicacla por R. L. Thorndike, 1942 y
analizada a propsito de la equiparacin en el diseo 1O). El
sentido del seudoefecto de la regresin relativa a medias grupales despus ele la equiparacin es en este caso seguro, pues
las diferencias en los factores de equiparacin entre los que
lograron xito frente a los que no lo tuvieron tienen el mismo sentido para cada factor que las diferencias entre los que
completaron la escuela secundaria y los que la abandonaron
antes de finalizar sus estudios.
Cada determinante de exposicin a X es, de manera similar
y aun sin X, un determinante de O. Todas las variables
equiparadas correlacionan con X y O en el mismo sentido.
Aunque bien podra no ocurrir as en todas las variables de to
dos los estudios ex post facto, s acaece, si no en todos, en la
mayor parte de los ejemplos publicados. Este ,error y la reduc
cin en el nmero de casos pueden evitarse por medio de la esnlclstica moderna, que elude el error ele equiparacin en el
diseo 10.
Las variables de equiparacin podran ser utilizadas en su totalidad como covarables en un anlisis de covariancia con covariables mltiples. Estimamos con toda seriedad que ese anlisis eliminara los efectos aparentemente significativos en los
estudios especficos presentados por Chapn. (Vase, sin embargo, Lord [ 1960], por su crtica del anlisis de covariancia
para problemas de esta ndole.) Pero hay otra inevitable
fuente de subequiparacin en la configuracin ele Chapn.
Greenwood [ 1945] la designa con el nombre de autosdeccin de exposicin o no exposicin. La exposicin es consecuencia lgica de muchos antecedentes. En el caso del abandono
ele la escuela secundaria antes ele finalizarla, sabemos que son
innumerables los determinantes posibles, aclen~s de aquellos
sobre los cuales se hizo la equiparacin. Podemos suponer,
con gran seguridad, que casi todos ellos tendrn un efecto
similar sobre xitos ulteriores, independientemente de su efec136
to por medio de X. Este solo hecho aseg~~a que la s_ubequparacn sobrepasar el efecto de re~r~~ln por e9u1p~
racin. Aun con el predictor pre-X y el anahs1s de covanancra
de O solo es interpretable un efecto significativo de tratamien;o cuando se han incluido todas las variables equiparadas
que contribuyen en forma conjunta.
137
7. Comentarios finales
139
Referencias bibliogrficas
Brownlee, K. A.
1960. Statistical theory and methodology in scu'!JCt' '",/ , ''
gineering, Nueva York: Wiley.
Brunswik, E.
1956. Perception and the representative design of Jllv,f,,"
gical experiments, Berkeley: University of California l'w..
2a. ecl.
Allport, F. H.
1920. The influence of the group upon assocratwn and
thought, ]. Exp. Psychol., vol. 3, pgs. 159-82.
Anastasi, A.
1958. Dfferential psycholog,y, Nueva York: Macmillan, 3a.
ed. (Psicologa diferencial, Madrid: Aguilar, 1964.)
Anderson, N. H.
1959. Test of a model for opinion change,]. Abnorm. Soc.
Psychol., vol. 59, pgs. 371-81.
Batch, A. M., Trumbo, D. y Nangle, J.
1957. Social setting and conformity to a legal requirementr>
]. Abnorm. Soc. Psychol., vol. 55, pgs. 396-98.
'
Blalock, H. M.
1964. Causal inferences in nonexperimental research, Chapel
Hill: University of North Carolina Press.
Boring, E. G.
1954. The nature and the history of experimental control,
Amer. ]. Psychol., vol. 67, pgs. 573-89.
Box, G. ,E. ,P.
196 7. Bayesian approaches to sorne bothersome problems in
data analysis, en J. C. Stanley, ed., Improving experimental
design and statistical analysis, Chicago: Rand McNally.
Box, G. E. P. y Tiao, G. C.
1965. A change in level of a non-stationary time series,
Biometrika, vol. 52, pgs. 181-92.
Brim, O. G.
195 8. Family structure and sex role learning by children:
A further analysis of Helen Koch's data, Sociometry, vol.
21, pgs. 1-16.
Brolyer, C. R., Thorndike, E. L. y Woodyard, E.
1927. A second study of mental discipline in high school studies,]. Educ. Psychol., vol. 18, pgs. 377-404.
140
Campbell, D. T.
1957. Factors relevant to the validity of experimenls 111 '"
cial scttings, Psychol. Bull., vol. 54, pgs. 297-312.
1959. Methodological suggestions from a comparativc 1''"
chology of knowledge processes, Inquiry, vol. 2, pgs. 1 ').'
82.
1960. Recommendations for APA test standards regardi111~
construct, trait, or discriminant validity, Amer. Psycholo~irr
vol. 15, pgs. 546-53.
1963. From description to experimentation: Interprct ing
trends as cuasi experiments, en C. W. Harris, ed., Prob!C!!I\
in measuring change, Madison: University of Wisconsin Prcs~ ..
pgs. 212-42. 1
196 7. Administrative experimentation, institutional records.
and nonreactive measures, en J. C. Stanley, ed., Improui11:
experimental design and statistical analysis, Chicago: H.:u1,l
McNally.
Quasi-experimental designs for use in natural social sLt
tings, en D. T. Campbell, Experimenting, validating, kJ1ou
ing: Problems of method in the social sciences, Nueva York
McGraw-Hill, en preparacin.
Campbell, D. T. y Clayton, K. N.
1961. Avoiding regression effects in panel studies of con1
munication impact, Stud. Pub. Commun., n? 3, pgs. l)')
118.
Campbell, D. T. y Fiske, D. W.
1959. Convergent and discriminant validation by the multi
trait-multimethod matrix, Psychol. Bull., vol. 56, pgs. 81
105.
Campbell, D. T. y McCormack, T. H.
1957. Military experience and attitudes toward authority,
Amer. ]. Saciol., vol. 62, pgs. 482-90.
Cane, V. R. y Heim, A. W.
1950. The effects of repeated testing: III. Further expcn
141
Nuev:1
Chernoff, H. y Moses, L. E.
1959. Elementary decison theory, Nueva York: Wiley. (Teora y clculo elemental de las decisiom:s, Mxico: CECSA,
1967.)
Deutsch, M. y Collins, M. E.
1951. Interracial housing: A psychological evaluation of a so ..
Glass, G. V.
1965. Evaluating testing, maturation, and treatment effects
in a pretest posttest quasi-experimental desgn, Amer. Educ.
Res. ]., vol. 2, pgs., 83-7.
Glickman, S. R
1961. <<Perseverative neu.ral processes and consolidation of
the memory trace, Psychol. Bull., vol. 58, pgs. 218-33.
Glock, C. Y.
1955. Sorne applications of the panel rnethod to the stmly
142
143
Jost, A.
1897. Die Assoziationsfestigkeit in ihrer Abhangigkeit von
der Verteilung der Wiederholungen, Z. Psychol. Physiol. Sinnesorgane, vol. 14, pgs. 436-72.
Kaiser, H. F.
1960. Directional statistical decisions, Psychol. Rev., vol.
67, pgs. 160-67.
Katz, D., Maccoby, N. y Morse, N. C.
1951. Productivity, supervision, and morale in an office situation, Ann Arbor: University of Michigan, Survey Research
Center.
Kcmpthorne, O.
1952. The desing and analysis of experiments, Nueva York:
Wiley.
1955. The randomization theory of statistical inference,
]. Amer. Statist. Ass., vol. 50, pgs. 946-67; 1956, vol. 51,
pg. 651.
1961. The design and analysis of experiments, with sorne
reference to educational research, en R. O. Collier y S. M.
Elam, eds., Research design and analysis: The second annual
Phi Delta Kappa symposium on educational research, Bloomington, Ind.: Phi Delta Kappa, pgs. 97-133.
Kendall, M. G. y Buckland, W. R.
1957. A dictionary of statistical terms, Londres: Oliver &
Boyd.
Kennedy,]. L. y Uphoff, H. F.
19 39. Experiments on the nature of extra-sensory perception. III. The recording error criticisms of extrachance seores, J. Parapsychol., vol. 3, pgs. 226-45.
Kerr, W. A.
194 5. Experiments on the effect of mu sic on factory production, Appl. Psychol. Monogr., n<:> 5.
Lana, R. E.
1959a <<Pretest-treatment interaction effects in attitudinal studies, Psychol. Bu!!., vol. 56, pgs. 293-300.
1959b. <<A further investigation of the pretest-treatment interaction effect, J. Appl. Psychol., vol. 43, pgs. 421-22.
Lana, R. E. y King, D. ].
1960. Learning factors as determiners of pretest sensitization,]. Appl. Psychol., vol. 44, pgs. 189-91.
145
Lindquist, E. F.
1940. Statstical analysis in educational research, Boston:
Houghton Mifflin.
1953. Design and analysis of experiments in psycholagy and
education, Boston: Houghton Mfflin.
Barton, A. H. y Linz, J.
Lipset, S. M., Lazarsfeld, P.
1954. The psychology of voting: An analysis of poltica!
behavior, en G. Lindzey, ed., Handbook of social psycholagy,
Cambridge, Mass.: Addison-Wesley, pgs. 1124-75. (Manual
de psicologia social, Buenos Aires: Paids, en preparacin.)
Lord, F. M.
1956. The measurement of growth>~, Educ. Psychol.
Measmt., vol. 16, p1gs. 421-37.
1958. <<Furthcr problems in the measurement of growth,
Educ. Psychol. Measmt., vol. 18, pgs. 437-51.
1960. Large-sample covariance analysis when the control
variable is fallible,]. Amer. Statist. Ass., vol. 55, pgs. 30721.
Lubin, A.
1961. The interpretation of significant interaction, Educ.
Psychol. Measmt., vol. 21, pgs. 807-17.
Maxwcll, A. E.
1958. Experimeital design in psycholagy and the medica[
sciences, Londres: Methuen.
McCall, W. A.
1923. How to experiment in education, Nueva York: Macmillan.
McNemar, Q.
1940. A critica} examination of the University of Iowa studies of envronmental influences upon the L Q., Psychol.
Bull., vol. 37, pgs. 63-92.
1958. n growth measurement, Educ. Psychol. Measmt.,
voL 18, pgs. 47-55.
1962. Psychological statistics, Nueva York: Wiley, 3a. ed.
Meehl, P. E.
1954. Clnica! versus statistical prediction, Minneapolis: University of Minnesota Press.
Monroe, W. S.
1938. <<Genera] methods: Classroom experimentation, en
G. M. Whipple, ed., Yearb. Nat. Soc. Stud. Educ., vol. 37,
part. II, pgs. 319-27.
146
Mood, A. F.
1950. Introduction to the theory of statistics, Nueva York:
McGraw-Hill (Introduccin a la teora de la estadstica, Madrid: Aguilar, 2a. ed., 1969.)
Moore, H. T.
1921. The comparative influence of majority and expert opinon, Amer. ]. Psycbol., vol. 32, pgs. 16-20.
Morse, N. C. y Reimer, E.
1956. The experimental change of a majar organizationai
variable,]. Abnorm. Soc. Psychol., vol. 52, pgs. 120-29.
Myers, J. L.
1959. n the interaction of two scaled variables, Psychol.
Bull., vol. 56, pgs. 384-91.
Newcomb, T. M.
1943. Personality and social change, Nueva York: Dryden.
Neyman, J.
1960. lndeterminism in science and new demands on statisticians, ]. Amer. Statist. Ass., vol. 55, pgs. 625-39.
Nunnally, J.
1960. The place of statistics in psychology, Educ. Psychol.
Measmt., vol. 20, pgs. 641-50.
Page, E. B.
1958. Teacher comments and student performance: A seventy-four classroom experiment in school motivation, ].
Educ. Psycbol., vol. 49, pgs. 173-81.
Pearson, H. C.
1912. Experimental studies in the teaching of spelling,
Teacbers Col!. Rec., vol. 13, pgs. 37-66.
Pelz, D. C. y Andrews, F. M.
1964. Detecting causal priorities in panel study data,
Amer. Sodol. Rev., vol. 29,
836-48.
Peters, C. C. y Van Voorhis, W. R.
1940. Statistical procedures and ther mathematical bases,
Nueva York: McGraw-Hll.
Piers, E. V.
1954. Effects of instruction on teacher attitudes: Extended control-group design, tesis indita de doctorado, George
Peabody Coll.
1955. Abstract, Bull. Maritime Psychol. Ass., pgs. 53-56.
147
Popper, K. R.
1959. The logic of scientific discovery, Nueva York: Basic
Books. (La lgica de la investigacin cientfica, Madrid: Tecnos, 1965.)
Rankin, R. E. y Campbell, D. T.
1955. Galvanic skin response to negro and white experimenters,]. Abnorm. Soc. Psychol., vol. 51, pgs. 30-3.
Reed, J. e
19 56. So me effects of short term training in reading under conditions of controlled motivation, J. Educ. Psychol.,
vol. 47, pgs. 257-64.
Smitb, H. L. y Hyman, H.
1950. The biasing effect of interviewer expectations on sur
vey results, Publ. Opin. Quart., vol. 14, pgs. 491-506.
Simon, H. A.
1957. Models of man, Nueva York: Wiley.
Sobo!, M. G.
1959. Panel mortalitv and panel bias, ]. Amer. Statist.
Ass., vol. 54, pgs. 52:68.
Solomon, R. L.
1949. An extension of control group design, Psychol.
Bull., vol. 46, pgs. 137-50.
Sorokin, P. A.
1930. An experimental study of efficiency of work unde.r
various specified conditions, Amer. J. Social., vol. 35, pgs.
765-82.
Stan ley, J. C.
1955. Statistcal analysis of seo res from counterbalanced
tests, ]. Exp. Educ., voL 23, pgs. 187-207.
1956. Fixed random, and mixed models in the analysis of
variance as special cases of finite model 111, Psychol. Rep.,
voL 2, pg. 369.
19 57a. Controlled experimentation in the dassroom, ].
Exp. Educ., vol. 25, pgs. 195-201.
1957b. Research methods: Experimental design, Rev.
Educ. Res., vol. 27, pgs. 449-59.
1960. <nteractions of organisms with experimental variables as a key to the integration of organismic and variablemanipulating research, en E. M. Iluddleston, ed., Yearb.
Nat. Counc. Measmt. used in Educ., pgs. 7-13.
1961a. Analysis of a double nested design, Educ. Psychol.
Measmt., vol. 21, pgs. 831-37.
196lb. <<Studying status vs. manipulating variables, en ~
O. Coller y S. M. Elam, eds., Research design and analysts:
Tbe second Phi Delta Kappa symposium on educational research. Bloomington, Ind.: Phi Delta Kappa, pgs. 173-208.
1961c. Analysis of unreplicated threeway classifications, with
applications to rater bias and trait independence, Psychometrika, vol. 26, pgs. 205-20.
1962. Analysis-of-variance principies applied to the grading
of essay tests, ]. Exp. Educ., vol. 30, pgs. 279-83.
148
149
Rogers, e R. y Dymond, R. F.
1954. Psychotherapy and p:monality change, Chicago: University of Chicago Press.
Rosenthal, R.
1959. Research on experimenter bias>>, trabajo ledo en la
American Psychological Association, Cincinnat.
Roy, S. N. y Gnanadesik:m, R.
1959. Some contributions to ANO VA in one or more dimensions: 1 and 11, Ann. Math. Statist., vol. 30, pgs. 30417, 318AO.
Rozeboom, W. W.
1960. The fallacy of the nullhypothesis significance test
Psychol. Bull., voL 57, pgs. 416-28.
Rulon, P. J.
1941. Problems of regression, Harvard Educ. Rev., vol.
11, pgs. 213-23.
Sanford, F. H. y Hemphill,]. K.
1952. An evaluation of a brief course in psychology at the
U. S. Naval Academy, Educ. Psychol. Measmt., vol. 12,
pgs. 194-216.
Scheff, H.
1956. Alternative models for the analysis of variance, Ann.
Aiath. Statist., vol. 27, pgs. 251-71.
Thorndike, E. L. y Woodworth, R. S.
1901. The influence of improvement in one mental function
upon the efficiency of other functions, Psychol. Rev., vol.
8, pgs. 247-61, 384-95, 553-64.
Thorndike, R. L.
1942. Regression fallacies in the matched groups experiment>>, Psychometrika, vol. 7, pgs. 85-102.
Underwood, B. J.
1949. Experimental psychology, Nueva York: Appleton-Century-Crofts.
1954. An analysis of the rnethodology used to investigate
thinking behavior, trabajo ledo en la New York University
Conference on Human Problem Solving, abril de 1954. (Vase tambin C. L Hovland y H. H. Kendler, The New
York University Conference on Human Problem Solving,
Amer. Psychologist, vol. 10, pgs. 64-68.)
1957a. lnterference and forgetting, Psychol. Rev., vol. 64,
pgs. 49-60.
1957 b. Psychological research, Nueva York: Appleton-Century-Crofts.
Underwood, B. J. y Rchardson, ].
1958. <~Studies of distributed practice. XVIII. The influence of meaningfulness and intralist similarity of serial nonsense lists, ]. Exp. Psychol., vol. 56, pgs. 213-19.
1947. U. S. War Departrnent, Informaton and Education
Division, pinions about Negro infantry platoons in white
companies of seven divisions, en T. M. Newcomb y E. L.
Hartley, eds., Readings in social psychology, Nueva York:
Holt, pgs. 542-46. (Manual de psicologa social, Buenos Aires: Eudeba, 2 vols., 1964.)
Watson, R. l.
1959. Psychology of the child, Nueva York: Wiley.
Webb, E. J., Campbell, D. T., Schwartz, R. D. y Sechrest, L.
1966. Unobtrusive measures: Nonreactive research in the
social sciences, Chicago: Rand McNally.
Wilk, M. B. y Kempthorne, O.
1955. Fixed, mixed, and random models>>, ]. Amer. Statst.
Ass., vol. 50, pgs. 1144-67.
1956a. Corrigenda, ]. Amer. Statist. Ass., vol. 51, pg.
652.
1956b. Sorne aspects of the analysis of factorial experiments
L50
151
Indice onomstico
152
153
154
Indice general
7
9
Nota preliminar
64
l. Introduccin
65
65
10
10
11
14
16
19
19
20
29
31
4. Tres
dichos
32
32
38
49
53
53
54
56
57
59
61
156
68
70
5. Diseos cuasiexperimentales
71
118
123
123
127
Correlacin y causacin
El pretest relrospectivo
Estudios en panel
66
68
76
84
86
89
90
93
93
99
103
107
108
110
128
157
Biblioteca de sociologa
129
131
134
138
7. Comentarios finales
140
153
Referencias bibliogrMicas
Indice onomstico
158