Ato 1995

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA
UNIDAD I.
EL MTODO CIENTFICO
Lectura 2
Ato, G. M. (1995) Conceptos Bsicos. En: M. T.,
Anguera, J., Arnau, G. M., Ato, A. R.,
Martnez, Ll. J., Pascual, y S. G Vallejo.
Mtodos
de
Investigacin
en
Psicologa. Espaa: Sntesis Psicologa.
Cap. 2. pp 45-72
CONCEPTOS BSICOS ...................................................... 2

Introduccin ................................................................2
La inferencia causal como objeto .................................2
Dos teoras de la causacin........................................................................ 2
Dos tradiciones de la investigacin experimental ...................................... 3
Condiciones para el establecimiento de hiptesis causales........................ 4
La validez de la inferencia causal............................................................... 4
El papel de la aleatorizacin ........................................5
Las variables en el esquema de Kish .......................................................... 5
La variable de asignacin........................................................................... 6
Ventajas y desventajas de la aleatorizacin ............................................... 7
El problema del confundido..........................................8
Qu es el confundido?............................................................................... 8
El efecto del confundido............................................................................ 10
Sensibilidad y validez de la investigacin ..................11
La tipologa de la validez de Campbell y colaboradores 1) La tipologa de
1963 .......................................................................................................... 12
La tipologa de 1963 .........................................................................................12
La tipologa de 1979 .........................................................................................13
Tipologas de la validez alternativas.................................................................13
Hacia un esquema prctico de la validez ................................................. 15

Validez Interna .................................................................................................16
Validez De Constructo......................................................................................16
Validez Externa ................................................................................................17
Para profundizar en este tipo de contenidos consulte la obra:

Anguera, M., Arnau, J., Ato, G., Martnez, A., Pascual, Ll. y Vallejo. S.(1995)
Mtodos de Investigacin en Psicologa. Espaa: Sntesis Psicologa.
UNIDAD I EL MTODO CIENTFICO
CONCEPTOS BSICOS
Introduccin
La metodologa cuasi-experimental incorpora un conjunto de tcnicas

de diseo y anlisis estadstico para afrontar situaciones donde no es
posible o no es tico aplicar la metodologa experimental, o donde los
estrictos requisitos del mtodo experimental no se satisfacen. Interesa
por tanto a un amplio rango de disciplinas de carcter aplicado, cuyo
contexto de investigacin cae lejos del laboratorio y del ambiente
controlado donde la experimentacin suele aplicarse. Disciplinas tales
como la psicologa, la educacin, las ciencias polticas y econmicas, la
epidemiologa y algunas disciplinas jurdicas, entre otras, son
potenciales consumidoras de mtodos cuasi-experimentales. Sin
embargo, el caldo de cultivo donde se ha prosperado hacia la situacin
de que goza hoy la metodologa cuasi-experimental ha sido la
evaluacin de programas de intervencin social.
Fueron Campbell y Stanley quienes introdujeron el trmino cuasiexperimento en un prestigioso trabajo de 1963 y, ms tarde, ampliaron
en un difundido texto publicado 1979 por Cook y Campbell. El objeto que
inicialmente persiguieron fue proponer diseos de investigacin (junto
con sus tcnicas de anlisis estadstico asociadas), potencialmente
utilizables en contextos aplicados, donde la experimentacin clsica no
era aplicable, y que permitieran establecer inferencias causales vlidas.
Conviene no obstante precisar que los trminos cuasiexperimento y
cuasiexperimentacin no son universalmente aceptados. Esta
terminologa es comn dentro del vasto cuerpo de disciplinas que
constituyen las ciencias sociales y se asocia con la escuela de Campbell
y colaboradores. En ciencias de la salud, particularmente en
epidemiologa, suele emplearse en su lugar estudio comparativo
(Anderson et al., 1980) como una derivacin de lo experimental,
mientras que en otros contextos se emplean denominaciones ms
generales tales como estudio observacional (por ejemplo, Cochran,
1983) o investigacin controlada (Kish, 1975, 1987). Nos adherimos
aqu, en lo que a terminologa se refiere, a la escuela de Campbell y
colaboradores.
Hay tres aspectos esenciales que, desde nuestro punto de vista,
permiten caracterizar apropiadamente la naturaleza de la metodologa

cuasi-experimental. Son:
a) La inferencia causal como objeto.
b) El papel de la aleatorizacin.
c) El problema del confundido.
Consideramos a continuacin detenidamente estos tres aspectos.
La inferencia causal como objeto
Dos teoras de la causacin

Desde la perspectiva de la denominada teora de la manipulabilidad,
tambin conocida como teora de la actividad (Mackie, 1974; Cook,
Campbell y Peracchio, 1990; Cook y Shadish, 1994), la causacin
implica manipular deliberadamente algn agente que se encuentra bajo
control y observar inmediatamente despus si se produce un cambio en
el fenmeno como consecuencia de tal manipulacin. El vehculo
metodolgico ms apropiado es el experimento, cuyo objeto es describir
(y probar, en ltima instancia) si el cambio es funcin de la manipulacin,
pero no explicar cmo o porqu ocurri.
En contraposicin a esta concepcin simplista, muchos filsofos de la
ciencia aspiran hoy, por el contrario, a identificar relaciones causa-efecto
que son invariablemente ciertas porque todas las contingencias de las
que depende una relacin se conocen perfectamente; una perspectiva
denominada teora esencialista (Mackie, 1974; Cook, Campbell y
Peracchio, 1990; Cook y Shadish, 1994). La prioridad de esta teora se
centra ms en la explicacin causal que en la descripcin o la prueba del
agente causal, en determinar por qu se produjo una conexin causal (y
por ende, su perfecta prediccin) ms que en inferir que causa y efecto
se relacionan.
La simplicidad de la teora de la actividad, que supone un mundo real
caracterizado por la existencia de efectos principales que los
experimentos tratan de identificar, contrasta con el inalcanzable
conocimiento determinista de la teora esencialista. Por esta razn,
actualmente se conciben las relaciones causales en un contexto definido
por complejos constructos tericos de tratamiento, de respuesta, de
poblacin, de contexto y de perodo histrico. Los investigadores suelen
medir indicadores especficos de tales constructos tericos y utilizan
despus un experimento para probar si un resultado particular depende
de la interaccin estadstica del tratamiento con los indicadores

utilizados. Los denominados estudios metaanalticos se encargan

despus de sintetizar los resultados principales, identificando la mayora
de las contingencias causales predicadas por la teora esencialista y
permitiendo la generalizacin de las relaciones causa-efecto. Un
tratamiento profundo de los estudios metaanalticos se aborda en una
compilacin de Cook y otros (1992) y en una obra enciclpedica
recientemente editada por Cooper y Hedges (1994).
Dos tradiciones de la investigacin experimental
Por otra parte, no existe una concepcin monoltica de la
investigacin experimen tal. Dos diferentes tradiciones de investigacin
experimental conviven actualmente en la prctica cientfica moderna, a
saber:
a) Por un lado, existe un tipo clsico de experimentacin, ms
caracterstico de las ciencias fsicas y naturales y basado en la
variabilidad intraindividual, donde algn tipo de intervencin discreta
se aplica en el contexto del laboratorio sobre muestras idealmente
"puras" de materiales, con la finalidad de establecer predicciones
numricas precisas. El marco del laboratorio permite a los
investigadores un control ptimo de las condiciones fsicas y el
aislamiento de materiales y variables dentro de cmaras protectoras,
tubos de ensayo esterilizados, etc. Este tipo de tradicin experimental,
que Cook y Campbell (1986, p. 141) denominan tradicin del control y
aislamiento experimental, es el que se impuso en ciencias naturales
durante los siglos XVII y XVIII.
b)Por otro lado, existe otro tipo ms reciente de experimentacin,
ms caracterstico de las ciencias sociales y basado en la variabilidad
interindividual, consistente en sustituir el control y aislamiento
experimental por el control estadstico obtenido fundamentalmente
mediante procedimientos de asignacin aleatoria de mltiples
muestras a las condiciones experimentales. Este enfoque fue, en gran
medida, elaborado en el contexto de la investigacin agrcola por
Fisher y colaboradores (Fisher, 1935) e importado despus a la
psicologa y disciplinas afines, aunque existen interesantes
antecedentes de esta tradicin (por ejemplo, McCall, 1923). Cook y
Campbell (1986, p. 142) lo denominan tradicin del control estadstico.
Curiosamente, ambas concepciones de la experimentacin se
practican actualmente en las ciencias del comportamiento (Ato, 1991).
La primera concepcin fue adoptada por G. T. Fechner y W. Wundt,
aplicada entre otros por E. L. Thorndike, H. Ebbinghaus e I. P. Pavlov

durante el primer cuarto del siglo en psicologa experimental y, tras
complejas transformaciones, se practica hoy entre los seguidores de la
corriente skinneriana del Anlisis Experimental de la Conducta"
(Johnston y Pennypacker, 1980). El objetivo esencial de esta concepcin
es estudiar la conducta individual de uno (o de unos pocos) organismos,
usualmente bajo un rgido control experimental basado en las tcnicas
de eliminacin y constancia de variables extraas, con el objetivo de
encontrar relaciones funcionales estables entre la conducta y las
variables que la determinan.
El enfoque metodolgico cientfico-natural tuvo su punto lgido a
finales del siglo XIX y principios del XX; reducido inicialmente a los
confines del laboratorio y a la investigacin bsica, pas despus a
fundirse con la investigacin desarrollada en contextos aplicados durante
la dcada de los 60 y con la ulteriormente refinado, durante las dcadas
siguientes, originando un peculiar tipo de metodologa experimental
llamada metodologa de caso nico. Los aspectos cruciales de este
modo de proceder se abordan en otro lugar en este mismo texto (vase
Captulo 6).
La segunda tradicin experimental, de antecedentes menos remotos
y vinculada con la investigacin en ciencias sociales y el estudio de las
diferencias individuales, se convirti hacia mediados de siglo en la forma
ms comn de investigacin comportamental al mismo tiempo que el
enfoque cientfico-natural caa en descrdito. En psicologa y disciplinas
afines el control experimental ptimo de las infinitas variables extraas
practicado por el enfoque experimental tomado de las ciencias fsicas
resultaba en ocasiones imposible de obtener y, cuando se lograba, la
conducta resultante apareca trivial e irrelevante, en particular cuando el
estudio de la conducta se realizaba en marcos naturales, lejos del
laboratorio. Como consecuencia del desarrollo del razonamiento
estadstico moderno, de la mano de sir R. Fisher, J. Neyman, E. S.
Pearson y A. Wald, la tradicin del control estadstico desarroll el
experimento aleatorio, basado en la comparacin de grupos compuestos
de unidades de respuesta asignadas al azar y tratados diferentemente.
Esta idea se convirti en el enfoque normativo de la investigacin experimental para las ciencias sociales. (Vase Captulos 3 y 5.)
La metodologa cuasi-experimental se desarroll precisamente en el
seno de esta tradicin. Partiendo del experimento aleatorio como el
marco ideal para el establecimiento de relaciones causa-efecto,
propusieron alternativas al experimento aleatorio conservando todas las

propiedades de aqul, excepto la que justifica tal metodologa: la asignacin aleatoria de sujetos a tratamientos.
Condiciones para el establecimiento de hiptesis causales
Puesto que persigue el mismo ideal, la metodologa cuasiexperimental no renuncia por tanto al objetivo final del experimento, el
establecimiento de relaciones causa-efecto. Sin embargo, si tal objetivo
es fcil de cumplir en el caso experimental, en el cuasi-experimental es,
en ocasiones, muy difcil de alcanzar.
En el marco de la teora de la manipulabilidad, deben cumplirse
varias condiciones para concluir que dos variables se relacionan
causalmente y que la direccin de la causacin procede desde X
(supuesta causa o tratamiento) a Y (supuesto efecto o resultado). Kenny
(1979, pgs. 2-4) cita las siguientes:
1) En primer lugar, la causa X debe preceder en el tiempo al
efecto Y. Esta condicin se cumple siempre que los investigadores
sepan cundo se administr el tratamiento y registren los resultados
inmediatamente despus de su administracin. Sin embargo, cuando
se trata con sistemas dinmicos, en ocasiones puede aparecer cierto
grado de ambigedad en la direccin de la influencia causal, no
sabiendo si es X lo que produce Y o es Y lo que produce X.
2) En segundo lugar, causa y efecto tienen que covariar. La
existencia de covariacin se decide en cualquier caso utilizando
alguna prueba estadstica a un nivel de probabilidad arbitrariamente
seleccionado. La cuestin fundamental aqu se centra en determinar
si los resultados debidos al tratamiento (llamados efectos de tratamiento) son de suficiente magnitud para ser detectados por la
prueba estadstica aplicada. Dos tipos de errores que pueden afectar
a la conclusin estadstica pueden cometerse en esta situacin:
a) Concluir que existen efectos de tratamiento cuando de
hecho no existen (error tipo I). Este es el error que el
investigador decide cometer al fijar , la probabilidad de un
error tipo I.
b) Concluir que no existen efectos de tratamiento cuando
de hecho existen (error tipo 11).
3) En tercer lugar, no debe haber explicaciones alternativas del
efecto diferentes de la causa aducida. Esta es precisamente la
condicin ms difcil de cumplir en la metodologa experimental. Hay
dos cuestiones asociadas con el trmino "explicacin alternativa", a
saber:
a) Cuestionar si efectivamente X como variable manipulada
est causalmente relacionada con Y como variable medida.
Esta es una cuestin de validez interna (Campbell y Stanley,
1966). Es posible encontrar terceras variables (tambin
llamadas variables extraas perturbadoras o, para completar el
binomio X-Y, variables Z) que pueden explicar el cambio
producido en Y. La existencia de terceras variables es comn
en metodologa cuasi-experimental.
b) Cuestionar si las operaciones utilizadas en la
investigacin (comnmente llamadas indicadores en la
literatura psicosociolgica) son representativas de los
constructos tericos que se supone representan. Esta es una
cuestin de validez externa (Campbell y Stanley, 1966).
Muchas de las controversias actuales de las Ciencias Sociales
se centran precisamente en esta cuestin. Este problema
afecta por igual a experimentos y cuasiexperimentos.
La validez de la inferencia causal
La historia de la metodologa cuasi-experimental es inseparable del
desarrollo de una teora de la validez de la inferencia causal. Gran parte
de esta historia se debe al trabajo de Campbell y colaboradores
(Campbell, 1957; Campbell y Stanley, 1966; Cook y Campbell, 1979;
Campbell, 1986; Cook, Campbell y Peracchio, 1990), aunque es tambin
importante la aportacin de Cronbach (1982) y otros (vase Mark, 1986).
El anlisis se origin como consecuencia de la baja calidad de la
inferencia causal y la escasa generalizabilidad de los hallazgos
encontrados en la investigacin social aplicada. La teora de la validez
de la inferencia causal no es sino un conjunto de conceptos ideados con
la intencin de promover inferencias causales ms consistentes.
La conceptualizacin original (Campbell y Stanley, 1966) distingua
entre la validez para el establecimiento de relaciones causa-efecto en un
contexto particular (validez interna) y la validez para la generalizacin de
tales relaciones a otros contextos (validez externa). Ms adelante, se
incorporaron dos nuevos tipos de validez (Cook y Campbell, 1976,
1979), uno de los cuales trataba cuestiones relativas al empleo de
pruebas estadsticas para llegar a una conclusin particular (validez de
la conclusin estadstica) y el otro consideraba aspectos relativos a la
generalizacin desde los indicadores causa y efecto especficamente

empleados en la investigacin a sus correspondientes constructos de

referencia (validez de constructo).
Por su parte, Cronbach (1982) elabor el modelo T-R-U-C-O, que
tratamos ms adelante, como la estructuracin de un conjunto de
aspectos involucrados en una investigacin: Tratamiento, Respuesta,
Unidades, Contexto y Ocasin, aunque ste ltimo no fue inicialmente
propuesto por este autor. En cualquier caso, este esquema puede ser
tambin potencialmente utilizado para valorar la calidad de la inferencia
causal obtenida en una investigacin.
Gran parte de los debates actuales se centran en las virtudes de uno
u otro tipo de conceptualizacin (Campbell, 1986; Mark, 1986; Cook y
Shadish, 1994). Pero una teora de la validez, con los matices que se
quieran introducir, puede en la prctica aplicarse con provecho para
juzgarla calidad de la investigacin en muchas disciplinas aplicadas
(Wortman, 1983, 1994; Ato, 1991; Ato y Rabadn, 1991).
El papel de la aleatorizacin
Las variables en el esquema de Kish

En el esquema propuesto por Kish (1975; 1987) se distingue entre
dos grandes tipos de variables, a saber:
1)
Las variables que son el fundamento de la relacin
causa-efecto objeto de investigacin son las Variables Explicativas
(clase I). Las que actan como supuestas causas son las variables
independientes o variables de tratamiento (predictores) y las que se
toman como efectos son las variables dependientes o variables de
respuesta (criterios).
2)
Todas las variables ajenas a las que conforman la
relacin causal son Variables Extraas. Puede distinguirse a su vez
dos grupos de variables extraas:
a) Las Variables Controladas (clase II) constituyen un grupo
selecto de variables extraas que pueden ser adecuadamente
controladas por medio del diseo de investigacin. El control
puede ejercerse mediante tcnicas de seleccin (control
experimental), mediante tcnicas de estimacin (control
estadstico) o por ambas. En cualquier caso, tales
procedimientos se utilizan con el objeto de reducir los errores
aleatorios de las variables de la clase lE o los efectos de sesgo
de las variables de la clase IV.
b) Las Variables No Controladas constituyen el resto de

variables extraas. A su vez pueden distinguirse dos grandes
tipos:
i)
Las Variables Aleatorizadas (clase III) son
variables extraas no controladas que se tratan como
errores aleatorios. La aleatorizacin puede ser considerada
desde otra perspectiva como una forma de control
experimental, pero diferente del utilizado para variables de
la clase II.
ii)
Las Variables Perturbadoras (clase IV) son
variables extraas no controladas que pueden relacionarse
con las variables explicativas produciendo en ocasiones
una situacin denominada confundido.
En general, un diseo de investigacin es tanto ms eficiente cuantas
ms variables de la clase IV sea capaz el investigador de trasladar a la
clase II. La funcin de las pruebas estadsticas consiste en distinguir el
efecto sistemtico de las variables de la clase I de los efectos aleatorios
de las variables de la clase III dentro de niveles de probabilidad
especificados.
El objeto de la aleatorizacin en una investigacin experimental es el
traslado de todas las variables de la clase IV ala clase III. En un
experimento ideal, no existen variables de la clase IV; algunas variables
perturbadoras han sido trasladadas a la clase II (mediante control
experimental o estadstico) y la gran mayora son variables de la clase
III. Pero lo deseable es que se inviertan los trminos, puesto que al
colocar variables perturbadoras en la clase II se evitan los efectos
perjudiciales que tendran de encontrarse entre las variables de la clase
III. Adems, la separacin de variables de la clase I de la clase III
mediante aleatorizacin de todas las variables extraas de la clase III
supone la independencia entre ambos grupos de variables y las pruebas
estadsticas contrastan los efectos de las variables aleatorizadas contra
las variables explicativas.
Pero en una investigacin cuasi-experimental, la incorporacin de
una (o ms) variable/s perturbadora/s como variables de la clase II es un
objeto en s mismo, debido a que no existe aleatorizacin y por tanto no
es posible trasladar ninguna variable extraa de la clase IV a la clase III.
En tal caso, las variables perturbadoras pueden presentarse con
facilidad en situacin de confundido. Las pruebas estadsticas contrastan
en este caso los efectos de las variables explicativas de la clase I contra
las variables aleatorizadas de la clase III (si existen) confundidas con los

efectos desconocidos de las variables de la clase IV. Ms adelante

volveremos sobre ello.
La variable de asignacin
El diseo experimental tpico posee dos caractersticas distintivas
esenciales:
a) El control/manipulacin activa de (al menos) una variable
independiente.
b) El uso de una regla de asignacin aleatoria para asignar sujetos
a los niveles de la variable independiente.
Mientras que, tal y como lo entendemos aqu, el diseo observacional
y el diseo de encuesta no cumple ninguna de estas dos caractersticas,
el diseo cuasi-experimental cumple con la primera, pero no con la
segunda. Por el contrario, el diseo experimental con las dos.
A este aspecto, Judd y Kenny (1981, cap. 2) han distinguido entre
tres procedimientos para asignar sujetos a tratamientos. La variable (real
o ficticia) que produce el reparto de los sujetos entre los tratamientos es
la variable de asignacin y su regla de correspondencia es la regla de
asignacin. Partiendo del caso ms simple, donde slo hay dos grupos,
un grupo experimental (GE) que recibe un tratamiento y un grupo de
control (GC) que no lo recibe, la asignacin puede ser:
1) Aleatoria. Una vez seleccionada una muestra de cierta poblacin,
todos los sujetos de la muestra son asignados al azar a uno de los
dos grupos (GE y GC). En esta situacin puede afirmarse sobre
bases probabilsticas que los grupos son iguales antes de iniciar la
administracin del tratamiento en un abundante conjunto de
variables (denominadas variables aleatorizadas en el esquema de
Kish).
2) No aleatoria pero conocida. Los sujetos se asignan a uno de los dos
grupos (GE o GC) en funcin de la puntuacin obtenida en un
pretest de la misma medida utilizada para evaluar el impacto del
tratamiento.
3) No aleatoria ni conocida. No se conoce exactamente sobre qu
variable/s se constituyen los grupos GE y GC.
Explicaremos estos conceptos en el marco de un ejemplo.
Supongamos que un investigador se interesa por evaluar el impacto de
un programa de educacin compensatoria sobre el desarrollo cognitivo
de los nios medido con una conocida prueba. Para ello, decide trabajar
con un grupo de nios desventajados que recibir el programa (GE) y
otro grupo de nios, tambin desventajados, que no recibir el programa

(GC).
Un problema inicial concierne al modo como los nios se asignan a
una de las dos condiciones. El objetivo esencial reside en asegurar que
los nios obtengan puntuaciones similares en desarrollo cognitivo antes
de comenzar la administracin del programa. La nica forma de
garantizar este objetivo es acometer el proceso de asignacin de nios a
una u otra condicin sobre la base de alguna variable no relacionada con
la medida obtenida en el test.
La razn de ser del diseo experimental es precisamente que la
variable de asignacin no correlaciona, dentro de lmites probabilsticos,
con ninguna otra variable, es decir, es una variable cuyos valores se han
generado aleatoriamente. En el contexto del ejemplo, para conseguir
este objetivo, se precisa decidir que cada nio reciba el programa o no lo
reciba sobre bases estrictamente aleatorias. La regla de asignacin de
sujetos a uno de los dos grupos se dice entonces conocida y aleatoria y
su propsito es la equivalencia inicial entre GE y GC.
Ntese que, si GE y GC son inicialmente equivalentes, en ausencia
de efectos debidos al programa, es esperable que alcancen al final del
mismo puntuaciones iguales o muy similares. Resulta til imaginar la
variable de asignacin como una variable con dos valores (1 para el GE
y 0 para el GC) que se generan de forma estrictamente aleatoria. As,
por ejemplo, la tabla siguiente presenta las puntuaciones en desarrollo
cognitivo (DC) de 100 sujetos que se asignan a grupos siguiendo una
regla aleatoria donde es notorio que la asignacin a grupos es
independiente de la puntuacin obtenida por el sujeto en desarrollo
cognitivo (DC).
Sujeto
1
2
3
4
5
96
97
98
99
100
DC
41
62
39
43
46
49
60
54
45
57
Grupo
GC
GE
GE
GC
GE
GC
GE
GC
GC
GC
V. Asignacin
0
1
1
0
1
0
1
0
0
0
En general, en contextos sociales y educativos, la aplicacin de una

regla de asignacin aleatoria tropezar con el rechazo de los padres y
profesores. Una solucin quizs ms aceptable, aunque algo desviada

del propsito de la investigacin, consistira en administrar en el contexto

de una consulta psicolgica escolar el test de desarrollo cognitivo
administrar el programa al subconjunto de nios que obtuvieran
puntuaciones por debajo de una puntuacin de corte predeterminada y
no administrarlo al subconjunto que obtuvieran puntuaciones por encima
de tal puntuacin de corte. Al trmino del periodo de tratamiento, los
individuos participantes volveran a ser evaluados con el mismo
instrumento a fin de determinar el impacto del programa. En este caso, la
regla de asignacin no es aleatoria, aunque s es conocida puesto que la
administracin del tratamiento depende del resultado inicial obtenido en
el test de desarrollo cognitivo. La variable de asignacin en este caso
hace los grupos deliberadamente no equivalentes, pero las diferencias
son susceptibles de ajuste estadstico en el postest. As, suponiendo una
puntuacin de corte de 46 puntos, la asignacin a grupos de la tabla
anterior consistira en asignar a sujetos al GE si obtienen puntuaciones
iguales o superiores a 46 y al GC si obtienen puntuaciones inferiores, y
entonces la situacin queda como sigue:
V.
Sujeto
DC
Grupo
Asignacin
1
41
GC
0
2
62
GE
1
3
39
GC
0
4
43
GC
0
5
46
GE
1
96
49
GE
1
97
60
GE
1
98
54
GE
1
99
45
GC
0
100
57
GE
1
En muchas ocasiones se presentan situaciones en las que la regla de
asignacin no es aleatoria ni se basa en una variable conocida. En
nuestro caso, por ejemplo, si se deseara aplicar el programa de
educacin compensatoria en el marco de un aula especial ya constituida
(GE) y comparar con otra aula especial tambin existente (GC). El
problema que se plantea entonces es saber sobre qu influencia/s se ha
podido generar la variable de asignacin. Es extremadamente difcil
igualar GE y GC sobre la base de la variable de asignacin, porque es
desconocida. En tales casos es conveniente intentar igualar sobre la
variable de asignacin de forma indirecta, utilizando medidas pretest

para ajustar las diferencias en el postest.
Ventajas y desventajas de la aleatorizacin
La principal virtud de la aleatorizacin es que, con alta probabilidad,
los dos grupos 4o-bsico sern inicialmente similares en la variable
dependiente. La nica diferencia sistemtica existente entre ambos es
que uno (el GE) recibe el tratamiento, intervencin o programa de inters
mientras que el otro (el GC) no recibe el tratamiento. Por tanto, en
ausencia de efectos de tratamiento, la distribucin de la variable
de
pendiente ser similar en ambos grupos.
Anderson et al (1980, pgs. 32-35) han destacado las siguientes
propiedades de la aleatorizacin:
1)
La aleatorizacin generalmente implica una distribucin
similar de las caractersticas de sujeto en cada grupo y por tanto
facilita la inferencia causal. Si el nmero de sujetos es grande, es
improbable que los grupos difieran con respecto a alguna
caracterstica que pueda afectar al resultado bajo estudio.
2)
La aleatorizacin elimina los sesgos de seleccin. Si una
muestra seleccionada de una poblacin se asigna a grupos
mediante una regla de asignacin aleatoria, no existe ninguna
posibilidad de que los sesgos o preferencias iniciales de los investigadores sobre la naturaleza de los sujetos a quienes se
administrar el tratamiento, intervencin o programa puedan influir
en los resultados.
Aunque la aleatorizacin tiende a equilibrar los dos grupos con
respecto a potenciales variables perturbadoras, no excluye
absolutamente la posibilidad de que ambos grupos no queden
equibrados en una o ms caractersticas individuales. Esta
posibilidad es tanto menor cuando mayor es el tamao de los
grupos.
3)
La aleatorizacin proporciona una base para la
inferencia estadstica. El proceso de aleatorizacin permite asignar
probabilidades a diferencias observadas en la variable dependiente
bajo la hiptesis (nula) de que el tratamiento, intervencin o
programa no ejerce efecto alguno y practicar en consecuencia las
correspondientes pruebas de significacin.
Con todo, existen varias razones que aconsejan el empleo de
tcnicas de control diferentes ala aleatorizacin en ciertos casos.

Anderson et al. (1980, pgs. 36-7) destacan las siguientes:

a)
Los estudios no aleatorizados son a veces el nico
medio tico de realizar investigacin. En efecto, cuando la
naturaleza del tratamiento es potencialmente daina, no resulta tico
utilizar una regla de asignacin aleatoria. Por ejemplo, en
investigacin biomdica, para evaluar el efecto de una nueva droga.
En otras ocasiones, los supuestos efectos benficos de un programa
(por ejemplo, programas de educacin compensatoria) hacen
aconsejable que se administre a todos los posibles sujetos
receptores.
b)
Los estudios no aleatorizados son usualmente ms
baratos. Los estudios no aleatorizados requieren una planificacin y
control mucho menos extensivo que los estudios aleatorizados y por
ello son particularmente atractivos en las primeras etapas de un
problema de investigacin.
c)
Los estudios no aleatorizados se aproximan en mayor
medida a situaciones cotidianas. En la medida en que la
aleatorizacin difere de los mecanismos de seleccin natural, las
condiciones de un estudio aleatorizado pueden ser completamente
diferentes de aqullas en las que el tratamiento debe ser
ordinariamente aplicado.
El problema del confundido
Qu es el confundido?
Poco tiempo antes de aprobar la legislacin vigente acerca de la
obligatoriedad en el uso del cinturn de seguridad, un investigador X
intentaba determinar si la tasa de mortalidad (TM) de los conductores
involucrados en accidentes de automvil es funcin de la utilizacin del
cinturn de seguridad. Para ello eligi una "zona de alto riesgo", un
punto negro que exhiba una limitacin de velocidad de 60 Km/h, y
registr los 100 primeros accidentes que tuvieron lugar en dicha zona,
observando el estado fsico del conductor para determinar si se haba
producido la muerte (instantnea o demorada) o si por el contrario el
conductor result vivo del accidente. Los resultados se muestran en el
Cuadro 2.1.
CUADRO 2.1. Estado del conductor y uso de cinturn.
Uso del
cinturn
Estado del conductor
Tasa de
mortalidad
Muerto
Vivo
Total
S
No
6
9
54
31
60
40
6/60 = 0.100
9/40 = 0.225
Total
15
85
100
15/10 = 0.150
La tasa de mortalidad TM para quienes conducan con cinturn fue:

TM(S) = 6/60 = 0.100, mientras que para quienes lo hacan sin cinturn
fue: TM(No) = 9/40 = 0.225. En consecuencia, estos resultados
indicaban que es 2.25 veces ms probable un accidente de
consecuencias fatales cuando se conduce sin cinturn de seguridad que
cuando se conduce con l.
Esta interpretacin presenta serias deficiencias. Desde un punto de
vista lgico, la variable uso del cinturn" no puede entenderse como una
autntica variable causal, es decir resulta absurdo pensar que la causa
de la muerte sea precisamente llevar o no cinturn de seguridad, aunque
ciertamente parece, a la vista de los datos empricos, que puede
coadyuvar al resultado final. Afortunadamente, el investigador tambin
registr la velocidad (estimada) del vehculo en el momento del
accidente, y particularmente si era o no superior a 100 Km/h., una
velocidad con la que cualquier vehculo resultaba ya difcil de controlar
en el punto negro objeto de evaluacin. Un anlisis secundario de los
datos del Cuadro 2.1, incorporando la variable "Velocidad del vehculo",
se exhibe en el Cuadro 2.2.
Estos resultados conducen a una interpretacin muy diferente. La TM
para quienes circulaban a menos de 100 Km/h en el momento del
accidente fue muy baja para quienes llevaban cinturn: TM(S I < 100) =
2/55 = 0.036, y para quienes no lo llevaban: TM(No I < 100) = 1/30 =
0.033. Aunque existe una notable similaridad entre ambas tasas de
mortalidad, en realidad resultan prcticamente insignificantes. Por el
contrario, para quienes circulaban a ms de 100 Km/h, la TM fue muy
alta tanto para quienes llevaban cinturn: TM(S I > 100) = 4/5 = 0.800,

como para quienes no lo llevaban: TM(No I > 100) = 8/10= 0.800, una
tasa ms de 20 veces superior a la anterior.
CUADRO 2.2. Cuadro 2.1 en funcin de la velocidad del vehculo.
Velocidad Uso del Estado del conductor
del vehculo cinturn
Muerto Vivo Total
<100 Km/h
>100 Km/h
Tasa de
mortalidad
S
No
2
1
53
29
55
30
2/55 = 0.036
1/30 = 0.033
Total
82
85
3/85 = 0.035
Si
No
4
8
1
2
5
10
4/5 = 0.800
8/10 = 0.800
Total
12
15
12/15 = 0.800
Como probablemente habr ya sospechado, estos datos son

hipotticos. Se inspiran en un ejemplo similar desarrollado por Anderson
y otros (1980, p. 2-3). Su objetivo no es en absoluto impugnar la
indiscutible utilidad del cinturn de seguridad, sino ilustrar de una forma
intuitiva y didctica el importante problema interpretativo que supone la
exclusin de una variable importante. La variable "Velocidad del
vehculo" es, en este contexto, una tercera variable o variable de
confundido porque enmascara o confunde el efecto que la variable que
acta como independiente ("Uso del cinturn") posee sobre la dependiente ("Estado fsico final del conductor").
Ntese que, para cada uno de los niveles de la variable "Velocidad
del vehculo", el uso o no del cinturn de seguridad no tiene ningn
efecto sobre las tasas de mortalidad y por tanto puede afirmarse que el
"Uso del cinturn" es una variable irrelevante. Su relacin con el "Estado
fsico del conductor" despus del accidente se denomina espuria porque
se difumina como tal relacin (o sea, pasa a ser cero) despus de tomar
en cuenta los niveles de la variable "Velocidad del vehculo".
Esta relacin espuria puede comprobarse empricamente con el
estadstico de Mantel-Haenszel (1959; vase Fleiss, 1981), que prueba
la relacin funcional entre dos variables categricas binarias (en el
ejemplo, el "Uso del cinturn" y el "Estado del conductor") controlando
una tercera (la "Velocidad del vehculo"): (X2MH = 0.003; P = 0.958, lo que
conduce a admitir la hiptesis nula de no relacin entre ambas variables,
y por tanto, la supuesta relacin encontrada en el Cuadro 2.1 entre el
uso del cinturn y el estado del conductor se disipa tras controlar la
velocidad del vehculo en el momento del accidente (Cuadro 2.2).
La razn que justifica la relacin espuria encontrada entre el uso del
cinturn y el estado final del conductor accidentado se debe
seguramente a que la probabilidad de utilizar el cinturn de seguridad es
mayor entre conductores precavidos, que suelen respetar las seales de
trfico y conducir con prudencia, que entre conductores arriesgados, que
pasan por alto las seales de trfico y conducen con grave riesgo de sus
vidas. Las probabilidades respectivas son, para quienes conducan a
menos de 100 Km/h, 55/85 = 0.647 y para quien conducan a ms de
100 Km/h., 5/15=.333, aproximadamente la mitad.
Comprense, para matizar en mayor medida estos conceptos, los
datos del Cuadro 2.2 con los del Cuadro 2.3. Observe ahora que,
dependiendo de los niveles de la variable Velocidad del vehculo", las
tasas de mortalidad obtenidas usando o no el cinturn de seguridad son
netamente diferentes. Circulando a menosde 100 Km/h, no hay
diferencias entre las tasas de mortalidad: TM (Si |< 100) = 4/44 = 0.091 y
TM (No | < 100) = 3/33 = 0.091, mientras que circulando a ms de 100
Km/h, difieren por un factor de 6.85: TM(S |> 100) = 2/16 = .125 y
TM(No/ > 100) = 6/7 = 0.857.
CUADRO 2.3. Cuadro 2.2 reformulado con nuevos datos empricos.
S
No
4
3
40
30
44
33
Tasa
de
mortalidad
4/44 = 0.091
3/33 = 0.091
Total
70
77
7/77 = 0.091
Si
No
2
6
14
1
16
7
2/16=0.125
6/7 = 0.857
Total
15
23
8/23 = 0.348
Velocidad Uso del Estado del conductor

del vehculo cinturn Muerto Vivo Total
<100 Km/h
>100 Km/h
Esta situacin sugiere, contrariamente al caso anterior, que el uso del

cinturn no es una variable irrelevante, y por tanto no es espuria, puesto

que la relacin se mantiene despus de tomar en cuenta la variable de

confundido. Aplicando la prueba de Mantel- Haenszel (2MH = 4.650; P =
0.031, rechazamos la hiptesis nula de no relacin funcional entre el uso
del cinturn y el estado fsico del conductor controlando la velocidad del
vehculo. Ntese adems las escasas diferencias encontradas en las
probabilidades respectivas de utilizar el cinturn de seguridad entre
conductores que conducan a menos de 100 Km/h. (una probabilidad de
44/77 = 0.571) y los que lo hacan a ms de 100 Km/h. (una probabilidad
de 16/23 = 0.696). Pero lo ms importante en este caso es comprobar
que las tasas de mortalidad de los que llevan o no cinturn es la misma
para los que conducan a menos de 100 Km/h. (TM de 0.091 en ambos
casos) y netamente diferentes para los que conducan a ms de 100
Km/h, una situacin que induce a sospechar la existencia de interaccin
entre del "Uso del cinturn" y la "Velocidad del vehculo". En esta
situacin, se dice que la velocidad del vehculo es una variable
moderadora de la relacin funcional existente entre el uso del cinturn y
el estado fsico del conductor tras el accidente.
En resumen, la distorsin que una tercera variable produce sobre la
relacin funcional existente entre dos variables explicativas es
subsidiaria del cumplimiento de dos condiciones bsicas:
1)
La tercera variable muestra una alta relacin con la
variable de respuesta. Esta condicin se cumple en ambos casos.
En el Cuadro 2.2, tomando los totales de fila correspondientes (3,
82, 12 y 3) se rechaza la hiptesis nula de independencia (X21 =
58.478; P = 0.000) y en el Cuadro 2.3, con los totales de fila
respectivos (7, 70, 8 y 15) tambin se rechaza (X21 = 9.168; P =
0.002).
2)
La tercera variable se relaciona funcionalmente con la
variable independiente. Esta condicin se cumple en el Cuadro 2.2,
ya que tomando los totales de fila correspondientes (55, 30, 5, 10) y
aplicando una prueba al uso obtenemos una asociacin
estadsticamente significativa (X21 = 5.229; P = 0.022) entre la
velocidad del vehculo y el uso del cinturn. Pero no se cumple en el
Cuadro 2.3, ya que aplicando una prueba de asociacin sobre los
totales de fila correspondientes (44, 33, 16 y 7) obtenemos que
ambas variables son independientes (X21 = 1.139; P = 0.286).
10
tercera variable, y la relacin es espuria, lo cual demuestra que la

variable independiente es una variable irrelevante y que no existe
un vnculo causal con la variable dependiente. En esta situacin
se dice que la tercera variable es una autntica variable de
confundido.
b) En el Cuadro 2.3, la relacin entre variable independiente y
variable dependiente se mantiene cuando se toma en cuenta la
tercera variable, pero la relacin es diferente en funcin del nivel
de aqulla. En este caso se dice que la tercera variable es una
variable moderadora.
El efecto del confundido
Veamos otro ejemplo. Un investigador X desea saber si un programa
de adiestramiento cognitivo produce diferencias en riqueza de
"Vocabulario" en nios de primer ciclo de primaria. Para ello utiliza dos
grupos de nios, uno de los cuales (GE) fue tratado con el programa
mientras que el otro (GC) no sigui ningn programa especfico de
enriquecimiento. La asignacin a los grupos fue establecida por la
administracin del colegio donde tuvo lugar la experiencia, y utiliz como
GE alumnos voluntarios de primer ciclo y como GC sujetos tomados de
las mismas aulas.
Result que las distribuciones de "Edad" de ambos grupos eran
netamente diferentes y presentaban un promedio mayor en el GE que en
el GC. En concreto, los promedios de edad (enmeses) fueron, para el
grupo experimental, XGE = 80.410 y para el grupo de control, XGC =
69.820.
Los resultados finales del programa se exhiben en la Figura 2.1. Las
pendientes de regresin para los grupos experimental (GE) y control
(GC) fueron, respectivamente:
YGE = bo E + b,XcE = -24.770 + 1.994XGE
YGC = b0GC + b1XGC = -90.057 + 2.042XGC
a) En el Cuadro 2.2, la relacin entre variable independiente y

variable dependiente se difumina cuando se toma en cuenta una
11
entonces = YGE -YGC = 135.568 - 52.515 = 83.053 y la estimacin

del efecto de tratamiento (83.053) no coincide con el efecto de
tratamiento real encontrado (65.287). La diferencia es, precisamente,
una medida del sesgo de estimacin,
YGE- YGC = (BoGE + B1XGE) (B0GC + B1XGC)
= (BoGE + B1XGC) + b1 (XGE - XGC)
= Efecto de tratamiento + Efecto de sesgo
La Figura 2.2 resume grficamente este resultado.
EDAD (en meses)
Figura 2.1. Pendientes de regresin para GE y GC.

La pendiente b1, que suponemos estadsticamente diferente de cero,
es prcticamente similar en las dos ecuaciones, como se observa en la
figura, pero las intercepciones b0GE y b0GC son diferentes (ntese que X
se representa desde el valor 50).
En este caso, la variable "Edad" cumple las condiciones que
sealamos anteriormente para identificar una variable de confundido. En
primer lugar, la riqueza de vocabulario mejora con el aumento en edad
(primera condicin, que se comprueba si > 0 y en segundo lugar, los
grupos GE y GC tienen distribuciones de edad con medias diferentes
(segunda condicin, como puede observarse en la Figura 2.1). Si
asumimos adems que edad y programa de adiestramiento son los
nicos factores que afectan al enriquecimiento de vocabulario, o lo que
es lo mismo, que ambas variables se miden sin error, es posible
determinar el efecto de tratamiento real mediante la distancia vertical
entre las intercepciones, o sea, = b0GE - b0GC = -24.77 - (-90.057) =
65.287.
Cuando la variable dependiente es numrica, en el caso de dos
grupos el efecto del tratamiento puede estimarse fcilmente calculando
la diferencia en los promedios de los grupos: d = YGE - YGC y en
consonancia con las ecuaciones anteriores:
YGE = b0GE + b1 XGE = -24.770 + 1.994 XGE = -24.770 + (1.994) (80.410)
= 135.568
YGC = b0GC + b1XGC = -90.057 + 2.042 XGC = -90.057 + (2.042)
(69.820) = 52.515
Figura 2.2. Descomposicin del efecto de tratamiento en presencia de

sesgo.
Ntese que el sesgo de estimacin sera cero si las distribuciones de
edad de ambos grupos fueran exactamente iguales, pues en tal caso los
promedios de edad para GE y GC coincidiran en una misma vertical y d
seria igual a S. Slo en este caso es posible obtener una estimacin
vlida del efecto de tratamiento. Esta situacin se representa en la
Figura 23. En la medida en que ambas distribuciones de edad discrepen,
tanto mayor ser el sesgo de estimacin correspondiente.
Sensibilidad y validez de la investigacin
Toda investigacin comienza con una hiptesis causal, que plantea

una relacin causal entre un Tratamiento (supuesta causa) y una

Respuesta (supuesto efecto) para alguna poblacin o Universo en algn

Contexto fsico y en una Ocasin temporal localizada. Los elementos de
este argumento se resumen en el acrnimo T-R-U-C-O. Dos ejemplos:
EDAD (en meses)
Figura 2.3. Descomposicin del efecto de tratamiento en ausencia de

sesgo.
a)
El programa "J" de enriquecimiento cognitivo mejora las
habilidades lingsticas de nios de baja extraccin social.
b)
La campaa publicitaria "K" sobre el peligro del tabaco
es efectiva para reducir el hbito en personas de alto nivel educativo
que viven en grandes ciudades.
Cuando se disea una investigacin, los constructos tratamiento o
causa (el programa "J" y la campaa publicitaria "K" en el ejemplo) y
respuesta o efecto (habilidades lingsticas y reduccin del hbito) tienen
que ser traducidos en operaciones susceptibles de manipulacin y/o
medida. Este proceso se denomina operacionalizacin. Una vez
finalizade la investigacin debe calcularse un efecto de tratamiento,
definido como la influencia del tratamiento sobre el resultado, y a
continuacin plantearse dos cuestiones esenciales:
a)
En primer lugar, si el efecto de tratamiento puede ser
detectable mediante una prueba estadstica al uso.
b)
En segundo lugar, si el efecto de tratamiento es
representativo y estable (no han intervenido en el mismo causas
12
ajenas al tratamiento) y generalizable (puede extrapolarse a otras

situaciones diferentes).
Ambas cuestiones se enraizan en el concepto general de validez. El
primer aspecto corresponde a lo que, siguiendo a Lipsey (1990) y Saxe y
Fine (1981), denominaremos aqu sensibilidad de la investigacin,
definida como la probabilidad de que un efecto, si est realmente
presente, pueda ser detectado. Esta es una cuestin objetiva abordable
estadsticamente. El segundo aspecto corresponde a lo que usualmente
se conoce por validez de la investigacin, y se refiere a la verosimilitud
de que lo que se detecta sea, de hecho, el efecto (terico) por el que el
investigador se ha interesado. Esta es una cuestin eminentemente
subjetiva que no es empricamente abordable.
La distincin se fundamenta adems en los conceptos de sesgo y
error. Cuando se estima un efecto de tratamiento, la subestimacin o
sobreestimacin de la magnitud del efecto es un sesgo e indica que se
ha producido algn tipo de confundido. Sin embargo, puede suceder que
el efecto de tratamiento se haya estimado sin sesgo pero que ocurra
algn error al concluirse que el tratamiento es significativo, cuando de
hecho no lo es (error tipo I) o al concluir que el tratamiento no es
significativo cuando en realidad s lo es (error tipo II).
Esta situacin se produce porque tal conclusin se adopta en base al
resultado de una prueba estadstica, que en trminos muy generales
puede definirse como una razn entre un efecto de tratamiento
(componente sistemtico), en el numerador, contra otras fuentes de
variacin no sistemticas, ajenas al tratamiento (componente aleatorio),
en el denominador. Un equilibrio inadecuado entre ambos componentes
puede producir conclusiones inapropiadas.
La tipologa de la validez de Campbell y colaboradores 1) La tipologa de 1963
La tipologa de 1963
Como se apunt ms arriba, fue en un trabajo de Campbell y Stanley

(1966), posteriormente publicado de forma monogrfica (1966), donde
por primera vez se plantea una tipologa de la validez de la investigacin,
que distingua entre:
a)
La validez interna, que se refiere al grado de confianza
con que puede inferirse si una relacin causa-efecto entre dos (o
ms) variables es o no interpretable en el sentido apuntado por el

investigador.
b)
La validez externa que concierne al grado de confianza o
credibilidad con que puede concluirse si una relacin causa-efecto
encontrada entre dos (o ms) variables es o no representativa, o
sea, puede ser generalizada a otros contextos diferentes a aqul
utilizado por el investigador.
13
conclusin estadstica.
b)
Suponiendo que tal relacin exista, es la variable de
tratamiento la que causa el resultado o efecto o por el contrario ste
se habra obtenido en ausencia de aqulla?: Validez interna.
c)
Suponiendo que la relacin es presumiblemente causal y
se ha obtenido con indicadores de constructos causa y efecto
arbitrariamente elegidos, cules son los constructos causa y efecto
particulares involucrados en la relacin estudiada? Qu relacin
mantienen con los indicadores utilizados? Hasta qu punto puede
generalizarse de indicador a su constructo?: Validez de constructo.
d)
Y similarmente, dada una relacin supuestamente causal
obtenida con indicadores de los constructos de poblacin de
individuos (indicador: muestra de sujetos), contexto de investigacin
(indicador: lugar fsico donde se realiza la investigacin) y momento
temporal, hasta qu punto puede generalizarse desde los indicadores a sus constructos respectivos?: Validez externa.
Para cada tipo de validez, Campbell y Stanley presentaron y

discutieron una lista de posibles amenazas contra la validez; es decir, de
hiptesis rivales verosmiles, que potencialmente podran explicar los
resultados. Como expresaron sus autores: "ambos criterios son sin duda
importantes, aunque con frecuencia se contrapongan, en el sentido de
que ciertos aspectos que favorecen a alguno de ellos perjudica (de
alguna forma) al otro. Si bien la validez interna es el sine qua non y a la
cuestin de la validez externa, como a la de la inferencia inductiva,
nunca se puede responder plenamente, es obvio que nuestro ideal lo
constituye la seleccin de diseos ricos en una y otra validez" (Campbell
y Stanley, 1966/1973, pgs. 16-17). La validez interna inclua un total de
8 amenazas; la validez externa, slo 4.
La lista original de amenazas contra los cuatro tipos de validez se

presenta en el Cuadro 2.4.
La tipologa de 1979
Tipologas de la validez alternativas
La aparicin de ciertas ambigedades interpretativas llevaron a sus

autores a ensayar ms tarde una nueva conceptualizacin, desarrollada
a partir de la anterior, que se public primero en un manual sobre
psicologa industrial (Dunnette, 1976) y luego en una monografa sobre
cuasi-experimentacin (Cook y Campbell, 1979).
La nueva conceptualizacin de la validez ampli la dicotoma
interna/externa incorporando dos nuevos tipos de validez (validez de la
conclusin estadstica y validez de constructo), ampli la lista de
amenazas hasta un total de 33 y proporcion una definicin algo ms
explcita de validez: "Utilizamos los conceptos de validez e invalidez para
hacer referencia a la mejor aproximacin disponible a la verdad o
falsedad de las proposiciones" (Cook y Campbell, 1979, pg. 37).
La justificacin y jerarquizacin de esta tipologa, segn afirman sus
autores, se fundamenta en la correspondencia con la prctica cotidiana
del investigador, quien se plantea los pasos siguientes durante el
proceso de investigacin:
a)
Existe una relacin funcional establecida entre la
variable de tratamiento y la variable de respuesta?: Validez de la
Pese a que la conceptualizacin de Campbell y colaboradores ha

pasado a pertenecer al acerbo metodolgico de las ciencias sociales,
abundan otras tipologas alternativas. Por ejemplo, Cronbach (1982),
Krathwohl (1985) y Trochim (1986). Un exhaustivo anlisis de Mark
(1986) destaca que todas ellas tienen en comn la descripcin de las
relaciones causa-efecto cuyos cinco elementos esenciales pueden
resumirse con un argumento que refleja el acrnimo T-R-U-C-O:
El tratamiento (T) produce un respuesta (R) con las unidades (U)
dentro del contexto (C) y en la ocasin (O).

CUADRO 2.4. Amenazas contra la validez: Cook y Campbell (1979).
Validez de
la
conclusin
estadstica
Baja potencia estadstica.

Violacin de los supuestos de las pruebas estadsticas.
Violacin del error tipo I.
Fiabilidad de la medicin de la respuesta.
Fiabilidad de la administracin de los tratamientos.
Irrelevancias aleatorias del contexto de investigacin.
Heterogeneidad aleatoria de las unidades de respuesta.
Validez
interna
Historia.
Maduracin.
Administracin de pruebas.
Instrumentacin.
Regresin estadstica.
Seleccin.
Mortalidad selectiva.
Interacciones con seleccin.
Ambigedad en la direccin de la relacin causa-efecto.
Difusin e imitacin de tratamientos.
Igualacin compensatoria de tratamientos.
Rivalidad compensatoria de los sujetos.
Desmoralizacin de los sujetos.
Validez de
constructo
Explicacin preoperacional inadecuada.

Sesgos derivados del uso de una operacin nica.
Sesgos derivados del uso de un solo mtodo.
Adivinacin de hiptesis.
Recelo de evaluacin.
Expectativas del experimentador.
Confusin de constructos y niveles de constructo.
Interaccin de tratamientos intrasujeto.
Interaccin de administracin de pruebas y tratamiento.
Generalidad restringida entre constructos.
14
Cronbach (1982), quien distingue tres niveles de generalizacin para

cada uno de los elementos involucrados en la relacin, a saber:
Un primer nivel de indicador, etiquetado con letras

minsculas, que representa la particular operacionalizacin de
tratamiento (t), respuesta (r), unidad (u), contexto (c) y ocasin (o).
Este ltimo es un elemento no contemplado por Cronbach pero que
incluimos aqu con propsitos pedaggicos comparativos.
Un segundo nivel de constructo real, etiquetado con

letras maysculas, que representa los constructos causa (T), efecto
(R), poblacin (U), contexto (C) y ocasin (0) involucrados en la
investigacin.
Un tercer nivel de constructo extrapolado, etiquetado con

letras maysculas con asterisco, que representa un nivel superior de
generalizacin a los constructos causa (*T), efecto (*R), poblacin
(*U), contexto (*C) y ocasin (*O).
La Figura 2.4 (modificada de Cook, Campbell y Peracchio, 1990, pg.
496) representa las ideas fundamentales del esquema de Cronbach. Las
lneas continuas representan aqu la generalizacin de indicador a
constructo real; las discontinuas, la generalizacin de indicador a
constructo extrapolado.
Figura 2.4. Notacin del concepto de validez segn Cronbach (1982).
Validez
externa
Interaccin seleccin-tratamiento (validez de poblacin).

Interaccin contexto-tratamiento (validez ecolgica).
Interaccin historia-tratamiento (validez histrica).
Quiz la ms interesante de todas ellas sea la formulada por
En el argumento TRUCO, la correspondencia entre los elementos

bsicos del proceso de investigacin y la tipologa de Campbell y
colaboradores es clara: los elementos (T) y (R) conciernen
respectivamente a la validez de constructo de causas y efectos, los
elementos (U), (C) y (O) corresponden a los aspectos fundamentales de
la validez externa (validez de poblacin, validez ecolgica y validez

histrica, respectivamente) mientras que la validez interna est

representada en la flecha unidireccional existente entre (t) y (r).
Ntese la importancia crucial que se atribuye aqu al nivel de
generalizacin, y por ende el papel que ocupa la teora en la
generalizacin de resultados. Para cada elemento, con excepcin de la
flecha, existe un nivel de generalizacin que parte de un elemento
concreto hasta alcanzar un nivel de generalizacin ptimo. As, el
elemento (u) se refiere a una muestra particular de unidades de
respuesta empleada en una investigacin, pongamos por caso, nios
desfavorecidos de barrios pobres de colegios de Madrid capital. La
generalizacin a una poblacin superior concierne a la validez de
poblacin y supone la existencia de un nivel de generalizacin cuya
delimitacin y alcance corresponde definir al investigador, que puede
quedarse a un nivel ligeramente superior, por ejemplo colegios de
barrios pobres de la comunidad autnoma de Madrid, o un nivel muy
superior, por ejemplo colegios de barrios pobres de colegios espaoles.
Lo mismo cabe aplicar al resto de los elementos presentes en el
argumento.
Una situacin peculiar se presenta en la conexin entre tratamiento y
resultado, conexin "nica" en lo que concierne al resultado pero
"exclusiva" en lo relativo al tratamiento (puesto que es posible considerar
tratamientos alternativos que hayan producido el mismo resultado). Por
lo tanto, el problema que se plantea aqu es el nivel de exclusividad del
tratamiento (t) para producir el resultado (r). Este es esencialmente el
concepto de validez interna.
Y finalmente, no aparece en el argumento ningn elemento que se
corresponda con la validez de la conclusin estadstica. Efectivamente,
este tipo de validez plantea esencialmente una cuestin objetiva (cul
es el efecto del tratamiento observado?), y por ello se considera hoy ms
bien como una cuestin de sensibilidad y no de validez, como
apuntamos anteriormente.
Hacia un esquema prctico de la validez
El esquema de la validez de Campbell y colaboradores se ha
mostrado eficaz (Ato y Rabadn, 1991) para evaluar investigaciones
originales con la finalidad de obtener una valoracin subjetiva tanto del
nivel de exclusividad en la explicacin del efecto (validez interna) como
del nivel de generalidad de los elementos de la investigacin (validez externa y validez de constructo). Adicionalmente, tambin se puede
15
emplear para valorar la consistencia de la relacin funcional

(sensibilidad).
Subsisten sin embargo algunas ambigedades en la lista de
amenazas propuesta por Cook y Campbell en 1979, y que en parte han
sido subsanadas en una presentacin ms reciente (Cook, Campbell y
Peracchio, 1990).
Dada una investigacin determinada, la evaluacin de cada uno de
los elementos de la lista de amenazas contra la validez no tiene otro
objeto que contribuir a que el investigador (o posteriormente, el
evaluador o consumidor de la investigacin) descarte todas las fuentes
verosmiles de sesgo que pueden arruinar su investigacin, y en el caso
de no asegurar tal descarte, utilizar los procedimientos necesarios para
que no sean verosmiles las fuentes de sesgo sospechosas.
Sin embargo, para que el esquema resulte atractivo, se precisa una
definicin sencilla y comprensible de las 33 amenazas que se contienen
en el Cuadro 2.4, utilizando una clasificacin ms pragmtica de las
mismas, e incorporando la conceptualizacin de Cronbach (1982). La
que proponemos aqu se fundamenta en definiciones ms recientes de
las amenazas (Cook, Campbell y Peracchio, 1990; Ato y Navaln, 1993)
y su insercin en una estructura arbrea que facilita en mayor medida su
lectura y recuerdo. Presentamos para cada una de las fuentes una breve
explicacin de su significado. Un anlisis ms detenido de cada una de
las amenarac puede consultarse originalmente en Cook y Campbell
(1976; 1979) y, ms recientemente, en Cook, Campbell y Peracchio
(1990). En castellano, puede tambin consultarse Ato y Rabadn (1991)
y Ato (1991, cap. 6). El resumen de todas las fuentes se encuentra en el
Cuadro 2.5.
CUADRO 2.5. Amenazas contra la validez: reconceptualizacin.
"Validez
interna
Asociados
al tiempo
1. Historia
2. Maduracin
Sesgos en
comparaciones Asociados a 3. Administracin de pruebas
la medicin 4. Instrumentacin
intrasujeto
Asociados a 5. Mortalidad diferencial
la seleccin 6. Regresin estadstica

Sesgos en
comparaciones
intersujetos
7. Seleccin
8. Interacciones con seleccin
9. Ambigedad de la direccin causaefecto
Sesgos de
operacionalizacin de
los constructos T y R
10. Explicacin preoperacional inadecuada

11. Empleo de una operacionalizacin
nica
12. Empleo de un mtodo nico de
operacionalizacin
Validez
de
Constructo
Sesgos de
reactividad
de las unidades
de respuesta
Validez
externa
Sesgos de
generalizacin de los
constructos U, C y 0
Validez
externa
Sesgos de
generalizacin
menores
13. Efectos reactivos situacionales

14. Adivinacin de hiptesis
15. Artefactos de sujeto
16. Artefactos de experimentador
17. Interaccin seleccin-tratamiento
18. Interaccin contexto-tratamiento
19. Interaccin historia-tratamiento
20. Interaccin admistracin pruebastratamiento

21.
Interaccin
instrumentacintratamiento
22. Interaccin tratamientos intrasujeto
Validez Interna
Sesgos producidos con comparaciones intrasujeto (pre-post):

Representan un conjunto de sesgos que aparecen en situaciones
en que se comparan al menos dos medidas de los mismos sujetos
en un plazo de tiempo durante el cual tiene lugar la administracin
del tratamiento (comparaciones intrasujeto). Hemos dividido tales
sesgos en tres grandes clases, segn se relacionen con el paso del
tiempo, el proceso de medicin o el proceso de seleccinasignacin.
a) Asociados al tiempo
1. Historia: eventos especficos que ocurren al mismo
tiempo que el tratamiento.
2. Maduracin: procesos internos que operan a corto
16
(hambre, fatiga) o a largo plazo (envejecimiento).

b) Asociados a la medicin
3. Administracin de pruebas: efectos de administrar una
prueba sobre las puntuaciones obtenidas en una administracin
posterior.
4.
Instrumentacin: cambios en la calibracin de un
instrumento de medida (humano o mecnico).
c) Asociados a la seleccin
5.
Mortalidad diferencial: reduccin del tamao y/o
naturaleza original de los grupos durante el proceso de medicin.
6.
Regresin estadstica: tendencia hacia la centralidad
producida en grupos con unidades directa o indirectamente
seleccionadas sobre la base de sus puntuaciones extremas.
Sesgos producidos con comparaciones de grupo (intersujetos)
Representan un conjunto de sesgos apropiados a situaciones
donde se comparan al menos dos grupos de individuos
(comparaciones intersujetos) una vez que el tratamiento ha sido
administrado.
7. Seleccin: efectos producidos por la no equivalencia
inicial de los grupos (tratamiento y control) objeto de
comparacin.
8. Interacciones con seleccin: interaccin de la seleccin
con otras fuentes de sesgo anteriormente mencionadas
produciendo efectos espurios. Las ms comunes son la
seleccin-maduracin, que ocurre cuando grupos no
equivalentes maduran a diferente ritmo, y la seleccin-historia,
que se presenta cuando grupos inicialmente no equivalentes
experimentan historias locales diferentes.
9. Ambigedad de la direccin causa-efecto: efecto
producido cuando la precedencia temporal de la causa no es
clara. Suele aparecer en diseos no experimentales (diseo
correlacional por ejemplo).
Validez De Constructo
Sesgos de operacionalizacin de constructos (T) y (R)

Representan sesgos que reflejan una inadecuada operacionalizacin
de los indicadores, o bien porque los indicadores definidos no captan
todas las dimensiones que tericamente incorpora un constructo (subrepresentacin) o bien porque los indicadores incluyen aspectos que no

son relevantes para el constructo (irrelevancias sobreaadidas al

constructo). En ltima instancia, se trata tambin de un problema de
generalizacin de los indicadores de tratamiento y respuesta (t,r) a los
constructos correspondientes (T, R).
10. Explicacin preoperacional inadecuada: anlisis terico
minucioso de la naturaleza y los componentes del constructo
para derivar operaciones y mtodos de operacionalizacin que
conducirn a su definicin.
11. Empleo de una operacionalizacin nica: sesgo que
ocurre cuando se define una nica operacionalizacin de un
constructo, ya que la utilizacin de una sola operacin no suele
captar el constructo en su globalidad y obtiene indicadores con
irrelevancias.
12. Empleo de un mtodo nico de operacionalizacin:
sesgo que ocurre cuando se emplea un solo mtodo de
operacionalizacin, ya que la utilizacin de un mtodo de
operacionalizacin
nico
produce
indicadores
que
subrepresentan los constructos y contienen irrelevancias.
Sesgos de reactividad de las unidades de respuesta
Son un conjunto de sesgos que aparecen cuando los sujetos (o las
unidades de respuesta de la investigacin) se comportan de forma
reactiva, presentando conductas artificiales que se desvan de su
comportamiento natural. La consecuencia fundamental que producen es
una desnaturalizacin de los indicadores de tratamiento y respuesta, que
se desvan de sus constructos de referencia correspondientes y por ello
son tambin en ltima instancia un problema de generalizacin.
13. Efectos reactivos situacionales: incorporan amenazas
que generan cambios en el comportamiento de los sujetos y se
producen en situaciones sociales comparativas. Son la difusin
o imitacin de tratamientos, la igualacin compensatoria de
tratamientos, la rivalidad compensatoria y la desmoralizacin
de los sujetos que reciben los tratamientos menos deseables.
14. Adivinacin de hiptesis: los sujetos se esfuerzan
siempre por saber cmo el/los investigador/es desea/n que se
comporten, o sea, por conocer la hiptesis que el investigador
desea comprobar. En ocasiones en que la hiptesis es sencilla
de deducir, pueden generarse comportamientos reactivos. El
ejemplo ms conocido es el efecto Hawthorne (Roethlisberger
y Dickson, 1939).
17
15. Artefactos de sujeto: los sujetos desempean durante la

investigacin
papeles
especficos
que
desvirtan
considerablemente su conducta espontnea y natural (Weber y
Cook,1972).
16. Artefactos de experimentador: los investigadores se
esfuerzan por conseguir que el sujeto obtenga las
puntuaciones que confirmen su/s hiptesis (Rosenthal y
Rosnow, 1969).
Validez Externa
Sesgos de generalizacin de los constructos (U), (C) y (0).

Son un conjunto de sesgos relativos a los constructos de Unidades
de respuesta, Contexto y Ocasin temporal y que dificultan una
generalizacin apropiada de los mismos. Puesto que tal generalizacin
presupone que diferentes niveles del contracto presenten la misma
pauta para cada uno de los diferentes niveles del tratamiento, el
concepto de generalizacin se convierte en una cuestin de interaccin
constructo-tratamiento.
17. Interaccin seleccin-tratamiento: se conoce tambin por
validez de Poblacin. Se refiere ala generalizacin de (u) a (U).
18. Interaccin contexto-tratamiento: corresponde a la
denominada validez ecolgica. Se refiere a la generalizacin de
(c) a (C).
19. Interaccin historia-tratamiento: tambin conocido como
validez histrica. Se refiere a la generalizacin de (o) a (0).
Otros sesgos menores de generalizacin
Incorporan sesgos de generalizacin relativos a otros
constructos menores, diferentes de los clsicos constructos de
historia, contexto y unidad de respuesta.
20. Interaccin administracin de pruebas-tratamiento:
generalizacin del resultado a otras condiciones de
administracin de prueba diferentes a la utilizada.
21. Interaccin instrumentacin-tratamiento: generalizacin
del resultado a otras condiciones de instrumentacin diferentes
a la utilizada.
22. Interaccin de tratamientos intrasujeto: generalizacin
del resultado de la situacin en que los sujetos reciben ms de
un tratamiento a la situacin (hipottica) en que slo reciban
uno.


Ato 1995

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ato 1995

Cargado por

Copyright:

Formatos disponibles

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

CONCEPTOS BSICOS ...................................................... 2

Hacia un esquema prctico de la validez ................................................. 15

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

La metodologa cuasi-experimental incorpora un conjunto de tcnicas

permiten caracterizar apropiadamente la naturaleza de la metodologa

Dos teoras de la causacin

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

utilizados. Los denominados estudios metaanalticos se encargan

aplicada entre otros por E. L. Thorndike, H. Ebbinghaus e I. P. Pavlov

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

empleados en la investigacin a sus correspondientes constructos de

Las variables en el esquema de Kish

b) Las Variables No Controladas constituyen el resto de

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

efectos desconocidos de las variables de la clase IV. Ms adelante

otro grupo de nios, tambin desventajados, que no recibir el programa

En general, en contextos sociales y educativos, la aplicacin de una

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

del propsito de la investigacin, consistira en administrar en el contexto

variable de asignacin de forma indirecta, utilizando medidas pretest

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

Anderson et al. (1980, pgs. 36-7) destacan las siguientes:

Estado del conductor

La tasa de mortalidad TM para quienes conducan con cinturn fue:

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

Como probablemente habr ya sospechado, estos datos son

Velocidad Uso del Estado del conductor

Esta situacin sugiere, contrariamente al caso anterior, que el uso del

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

que la relacin se mantiene despus de tomar en cuenta la variable de

tercera variable, y la relacin es espuria, lo cual demuestra que la

a) En el Cuadro 2.2, la relacin entre variable independiente y

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

entonces = YGE -YGC = 135.568 - 52.515 = 83.053 y la estimacin

EDAD (en meses)

Figura 2.1. Pendientes de regresin para GE y GC.

Figura 2.2. Descomposicin del efecto de tratamiento en presencia de

Toda investigacin comienza con una hiptesis causal, que plantea

Para profundizar en este tipo de contenidos consulte la obra:

UNIDAD I EL MTODO CIENTFICO

MDULO 2201- LA INVESTIGACIN CIENTFICA EN LA PSICOLOGA

Respuesta (supuesto efecto) para alguna poblacin o Universo en algn