Está en la página 1de 20

Métodos de Investigación en Educación.

LA INFERENCIA CAUSAL Y LA ESTADÍSTICA

Apuntes
José Luis Gaviria

J. L. Gaviria 1
Métodos de Investigación en Educación.

J. L. Gaviria 2
Métodos de Investigación en Educación.

ÍNDICE
La inferencia causal y la estadística ......................................................................1
Apuntes............................................................................................................. 1
1.- El establecimiento de relaciones causales y la estadística .......................... 4
1.1.- Los supuestos de la solución científica. ............................................... 6
1.2.- Los supuestos de la solución estadística. ............................................. 7
1.2.1.- El supuesto de independencia. ...................................................... 8
1.2.2.- El supuesto del efecto constante.................................................... 9
2.- Consecuencias del modelo. ....................................................................... 10
3.- Acerca de la naturaleza de las causas........................................................ 13
4.- Referencias ................................................................................................ 19

J. L. Gaviria 3
Métodos de Investigación en Educación.

1.- El establecimiento de relaciones causales y la estadística


Desde cualquier punto de vista es para nosotros fundamental determinar cuál es
el papel de la estadística en el seno de la investigación educativa tal y como la
concebimos.
En este documento vamos a tratar de presentar esa cuestión. Veremos cómo
interviene la estadística en el establecimiento de las relaciones causales. Por otra parte,
dado que en otros documentos de esta asignatura hemos hecho gran hincapié en el
desarrollo de modelos explicativos como tarea fundamental de la investigación
educativa, vamos a ver cuál es la relación que existe entre la inferencia causal y la
investigación que responde a esquemas fundamentalmente observacionales, ya que los
modelos que se basan en este tipo de metodología son muy utilizados en nuestro ámbito.
Sobre la esencia del proceso de establecimiento de relaciones causales, se ha
escrito mucho.
Durante mucho tiempo la concepción de Hume acerca de la naturaleza de la
causalidad ha influido el pensamiento filosófico y científico. En el famoso ejemplo de
las bolas de billar empleado por Hume, tres son las condiciones que van anexas a
aquellos fenómenos en los que reconocemos la existencia de la causalidad. 1.-
Contigüidad. Si A causa B, en algún momento inmediatamente anterior a la observación
de la relación causal A debe entrar en contacto con B. (Es decir, no se admitía la acción
a distancia). De algún modo las teorías de campos (gravitacional, magnético) han
modificado el significado estrictamente mecánico de este principio. 2.- A es anterior a
B. Este supuesto no puede modificarse sin violar la primera ley de la termodinámica. Es
por tanto válido y aceptado hoy como tal. 3.- ‘Conjunción constante’. Siempre que A se
produce se produce B. Es este punto el que más críticas ha recibido, y a partir de cuyo
rechazo han surgido teorías nuevas acerca de la causalidad probabilística. Por ejemplo
la teoría de SUPPES (1970), de la que hablamos con un poco más detalle en otro punto.
Para HUME toda noción acerca de la causalidad entre fenómenos está basado en
la experiencia. Para COMTE esto llegó hasta el punto de considerar que la causalidad
no era una noción científica, sino metafísica.
Esta cuestión es de suma importancia en un ámbito como el de la educación, en
el que las relaciones entre causas y efectos nunca cumplirán la condición de conjunción
constante propuesta por Hume.

J. L. Gaviria 4
Métodos de Investigación en Educación.

Aquí no podemos revisar toda la bibliografía existente sobre el tema. Pero eso
no impide que presentemos uno de los análisis más lúcidos sobre la cuestión. Se trata
del modelo sobre el proceso de inferencia causal desarrollado por RUBIN (1974, 1978,
y 1980), y analizado brillantemente por HOLLAND (1986). En lo que sigue
presentaremos lo más claramente posible este modelo, y comentaremos las cuestiones
que quedan aclaradas cuando se hace uso del mismo, así como los puntos débiles y las
limitaciones que presenta.
En el modelo de RUBIN se distinguen dos tipos de estudios inferenciales, por
otra parte comúnmente admitidos. Se trata de la inferencia asociativa, lo que también
denominamos estudios correlacionales, y la inferencia causal propiamente dicha. En la
inferencia asociativa, se parte de una población U compuesta por unidades de análisis
individuales u. Sobre cada una de estas unidades de análisis se define una variable Y,
denominada variable de respuesta, y una variable A denominada atributo. Por cada
unidad u se define un valor de Y, Y(u) y un valor de A, A(u). En realidad no existe un
criterio intrínseco por el que la variable Y haya de ser la variable de respuesta. La única
razón, es que se trata de la variable de la que queremos conocer su distribución en
función de los valores de A. Los parámetros que determinan la forma concreta en que la
distribución de los valores de Y dependen de la distribución de los valores de A se
denominan los parámetros asociativos, un ejemplo de los cuales es el coeficiente de
regresión. La inferencia asociativa consiste en el establecimiento de inferencias
estadísticas acerca de los parámetros asociativos en función de los valores de las
variables A e Y recogidos de un subconjunto de la población U. En este sentido, la
inferencia asociativa no es mucho más que la estadística descriptiva.
En el establecimiento de relaciones causales también partimos de una población
U de unidades de análisis, a cada una de las cuales denominamos u. En el lenguaje
ordinariamente utilizado para hablar de causalidad, cuando decimos que A es causa de
B, parece que todo el mundo entiende lo que queremos decir. Sin embargo esta forma de
hablar oscurece, más que aclara la naturaleza de la inferencia causal. Al decir que A
causa B, estamos refiriéndonos implícitamente a otra causa A', con relación a la que
comparamos A. Esa causa A' puede ser no A. Así planteado el problema, al decir A
causa B, estamos diciendo, que la presencia del fenómeno A origina el fenómeno B, y
que la ausencia de A origina el fenómeno no B. Sólo de esta forma tiene sentido hablar
de causalidad. Si ocurriese que A origina B, pero no A origina también B, desde luego
todos estaríamos de acuerdo en que A no es causa de B. En el modelo de RUBIN por
tanto la comparación entre dos causas para llevar a cabo inferencias causales se hace
explícita. Y aunque este modelo no se refiere sólo a la inferencia causal en el contexto
experimental, hace uso de la terminología propia del mismo. Así, la variable S, indica a
qué causa se expuso una unidad de análisis. S=t indica tratamiento, y S=c indica
control. Por simplicidad se expone el modelo más sencillo, pero sería fácilmente
generalizable a cualquier número de tratamientos distintos.
Un punto fundamental de este modelo, es que todas las unidades de análisis u de
U deben poder exponerse en principio a las dos causas distintas t y c. En cuanto a las
respuestas obtenidas en cada sujeto como resultado de la exposición a las causas, en la
inferencia causal es necesario utilizar dos variables para recoger dichos efectos. Se trata
de Yt y de Yc. La primera recoge los valores correspondientes a cada sujeto en el caso de
que haya sido expuesto al tratamiento t, y la segunda los valores de cada sujeto en el
caso de que haya sido sometido al control. La confusión respecto a este punto viene del
hecho de que cuando se procede a la medición post-causal, para cada sujeto sólo se
recoge un valor de respuesta, por lo que podría pensarse que se trata de una sola

J. L. Gaviria 5
Métodos de Investigación en Educación.

variable de respuesta. Sin embargo en este modelo esa variable de respuesta que se mide
es Ys, y sus valores se obtienen por el algoritmo siguiente:
SI (S=t) ENTONCES Ys:=Yt;
SI (S=c) ENTONCES Ys:=Yc;
El efecto causal se define dentro del modelo por la diferencia: T=Yt(u)-Yc(u). Es
decir, el valor que se obtiene cuando se expone a una unidad de análisis al tratamiento t,
menos el valor que se obtiene cuando se expone esa misma unidad de análisis al control,
o de forma general al tratamiento c.
Como consecuencia de este modelo, HOLLAND (1986) define el ‘Problema
fundamental de la inferencia causal’. Ese problema, es que no pueden observarse
simultáneamente los valores Yt(u) e Yc(u), sobre la misma unidad de análisis.
Es interesantísimo comprobar cómo un modelo tan sencillo puede aportar tanta
claridad a una cuestión como la que estamos tratando. El Problema fundamental de la
inferencia causal no es nuevo, y de hecho todo el trabajo de investigación científica trata
en realidad de evitar sus consecuencias, pero en este modelo se hace patente y explícito
gracias a la distinción que en él se hace entre las variables de respuesta inobservables y
las respuestas efectivamente medidas. Se trata indudablemente de un problema grave,
pero eso no quiere decir que no sea posible la inferencia causal. Lo que ocurre es que,
como veremos, es imposible realizar inferencias causales sin asumir algunos supuestos
auxiliares que en sí mismos son incontrastables. Esos supuestos se agrupan en dos
grandes tipos de soluciones al problema fundamental. Se trata de la solución científica,
y de la solución estadística.
Antes de abordar la formulación de esos supuestos, resaltaremos que de los
elementos de este modelo (U, unidades de análisis, T tratamientos, Y, respuestas, y x,
relación entre U y T), aquéllas condiciones que se imponen acerca de U, T y x, dan lugar
a las distintas condiciones del diseño experimental. Mientras que los supuestos hechos
acerca de Y dan lugar a modelos causales.
En este sentido, el supuesto de homogeneidad de las unidades de análisis que se
menciona en el siguiente apartado es un modelo causal, ya que, como se verá
inmediatamente, se supone que Yit=Yt para todo t ⊂ T. Pero por la misma razón el
modelo de la hipótesis nula de Fisher, es un modelo causal, ya que suponen que Yit=Yi
para todo t ⊂ T. (HOLLAND, 1993)
1.1.- LOS SUPUESTOS DE LA SOLUCIÓN CIENTÍFICA.
En la solución científica el problema fundamental de la inferencia causal puede
resolverse de dos formas. En la primera de ellas se hace uso de dos supuestos: el
supuesto de estabilidad temporal y el supuesto de transitoriedad causal. Por el
primer supuesto, no importa cuándo se aplique c a la unidad u, ya que sea cuando sea se
obtendrá siempre el mismo valor Yc(u). Según el segundo supuesto, el valor Yt que se
obtiene después de haber aplicado t a u, no se ve afectado por el hecho de que
previamente u haya recibido el valor c de S. Es lo que ocurre cuando queremos
averiguar el efecto de la temperatura sobre la dilatación de cierto metal. No importa
cuándo apliquemos la temperatura c al metal, ya que la respuesta obtenida, la dilatación
Yc será siempre la misma. Si posteriormente aplicamos la temperatura t a ese mismo
metal, la dilatación obtenida Yt no se verá afectada por el hecho de que la barra de metal
haya sido previamente sometida a la temperatura de control. Insistimos que éstos son
supuestos, y que no hay forma de contrastarlos en la práctica.
Una segunda forma de dar respuesta al problema que estamos tratando es el
hacer uso de otro supuesto; el supuesto de homogeneidad de las unidades de análisis.

J. L. Gaviria 6
Métodos de Investigación en Educación.

Según este supuesto, los valores obtenidos al aplicar t o c a u1 son los mismos que se
obtendrían al aplicar t o c a u2. Es decir, Yt(u1)=Yt(u2) y Yc(u1)=Yc(u2). Por lo tanto
puede obtenerse T, el tamaño del efecto, como T=Yt(u1)-Yc(u2). Es lo que se hace
cuando para resolver el problema de la dilatación de un metal, utilizamos dos barras
distintas de la misma aleación y sometemos a cada una de ellas a distintas temperaturas.
En la primera solución incumplimos el requisito de que la exposición de la unidad de
análisis a los tratamientos sea simultánea, y en la segunda incumplimos el requisito de
que lo que se exponga a los tratamientos sea la misma unidad de análisis.
1.2.- LOS SUPUESTOS DE LA SOLUCIÓN ESTADÍSTICA.
La solución estadística a este problema consiste en obtener el efecto causal
medio. A este efecto medio se le llama T, y se obtiene por
T=ε(Yt-Yc)
Por las propiedades del operador esperanza matemática, tenemos que
T=ε(Yt)-ε(Yc).
En el modelo que estamos analizando Yt=Yt(u) y Yc=Yc(u). Esto quiere decir que
ε(Yt) es el valor medio de Yt obtenido sobre todos los elementos del conjunto U, y ε(Yc)
es el valor medio de Yc obtenido sobre todos los elementos del conjunto U. Pero los
datos que observamos en los elementos del conjunto U son (S, Ys) es decir, sabemos si
recibió tratamiento o era parte del grupo de control, y el valor que obtuvo en la variable
de respuesta correspondiente. Esto quiere decir que la información que nosotros
obtenemos de cada sujeto nos permite calcular con todos ellos sólo
ε(Ys|S=t)=ε(Yt|S=t)
y
ε(Ys|S=c)=ε(Yc|S=c)
y en este punto es importante destacar, que ε(Yt|S=t) no es lo mismo que ε(Yt), y
del mismo modo ε(Yc|S=c) no es lo mismo que ε(Yc). Y seguramente esto necesita
alguna aclaración.
En primer lugar, ε(Yt) es el valor medio de Yt calculado sobre todos los
elementos de U. Del mismo modo, ε(Yc) es el valor medio de Yc calculado sobre todos
los elementos de U. Sin embargo ε(Yt|S=t) es el valor medio de Yt calculado sólo sobre
aquellos sujetos que recibieron el tratamiento t, y de forma análoga, ε(Yc|S=c) es el
valor medio de Yc calculado sólo sobre aquellos sujetos que recibieron el tratamiento c,
o dicho de otro modo, que pertenecían al grupo de control. Tal vez se haga un poco
difícil de entender esto si tenemos en cuenta que en cada sujeto sólo se observa Yt o Yc,
en función del valor de S. Para comprender mejor esto, debemos entender que cada
sujeto, tiende o propende, a proporcionar un valor de Yt y un valor de Yc. En este punto
retomamos la teoría de la probabilidad como propensión, expuesta por POPPER.
Supongamos que sean Yt e Yc la propensión de cada sujeto en función de que se le
aplique el valor t de S o el valor c de S respectivamente. Por supuesto, esas
propensiones son inobservables. Tendríamos entonces una matriz como la de la tabla I.
Los valores Yti e Yci son las propensiones del sujeto i, y son por tanto valores
inobservables. A continuación asignamos a cada sujeto un valor arbitrario de S, bien t o
bien c. En ese momento, cuando se actualiza un valor de S, el correspondiente valor de
Ys se hace manifiesto.

J. L. Gaviria 7
Métodos de Investigación en Educación.

En la tabla siguiente los valores que se


Yt Yc S han hecho manifiestos están sombreados.
1 Yt1 Yc1
2 Yt2 Yc2
|
|
i Yti Yci
|
|
N Ytn YcN

Yt Yc S
1 Yt1 Yc1 t
2 Yt2 Yc2 t
| | | |
N/2 YtN/2 YcN/2 t
(N/2)+1 Yt(N/2)+1 Yc(N/2)+1 c
| | | |
N YtN YcN c
Recordemos que T=ε(Yt)-ε(Yc). Ahora podemos ver que,
1 N 1 N
ε (Yt ) = ∑ Yti y ε (Yc ) = ∑ Ycii
N i =1 N i =1
Sin embargo
n
1 2 1 N
N ∑ N N∑ ci
ε (Yt S = t ) = Yti y ε (Yc S = c) = Y
i =1
+1
2 2 2
Ahora es cuando ya se hace evidente que ε(Yt|S=t)≠ε(Yt) y ε(Yc|S=c)≠ε(Yc).
Supongamos que por alguna razón, t se aplicase a aquéllos casos en los que la
puntuación Yt a la que propenden fuese la mitad más baja en Yt. En ese caso, es claro
que ε(Yt)>ε(Yt|S=t).

1.2.1.- EL SUPUESTO DE INDEPENDENCIA.


Aquí es donde hace su aparición el supuesto de independencia. Según él, los
valores de S, t y c, se asignan independientemente de los valores de Yt e Yc. Sólo en ese
caso se cumple que ε(Yt)=ε(Yt|S=t) y ε(Yc)=ε(Yc|S=c) con lo cuál puede conocerse T, ya
que entonces T=ε(Yt|S=t)-ε(Yc|S=c).
Pero obsérvese que como antes, esta conclusión se mantiene sólo porque
aceptamos un supuesto que en sí mismo es incontrastable. Es muy interesante esta
forma de presentación, ya que en ella se hace manifiesto uno de los supuestos en los que

J. L. Gaviria 8
Métodos de Investigación en Educación.

se basa toda la inferencia causal-experimental, y por ello nos damos cuenta de cuáles
son los límites de la misma.
En muchas ocasiones se ha resaltado la importancia de la aleatorización en los
experimentos para garantizar la validez interna. Aquí queda patente que la importancia
de la aleatorización estriba en que con ese procedimiento tratamos de asegurarnos de
que se cumple el supuesto de independencia. Pero a pesar de todo, el cumplimiento
efectivo de ese supuesto es incontrastable.
A la diferencia ε(Yt|S=t)-ε(Yc|S=c) se le denomina en general ‘efecto causal
prima facie’, o ‘efecto causal aparente’ que en general es distinto del verdadero efecto
causal. Sólo cuando se cumple el supuesto de independencia se pueden igualar esos dos
valores.

1.2.2.- EL SUPUESTO DEL EFECTO CONSTANTE.


El efecto causal medio (T) que se estudia en la solución estadística al ‘principal
problema de la inferencia causal’, es muy importante en lo referido a grupos. De hecho
el supuesto de independencia permite establecer inferencias causales, sólo en referencia
a los grupos o a la población en la que se estimó T. Pero si queremos establecer
inferencias causales respecto a cada unidad individual u de U, debemos sostener el
supuesto del efecto constante, según el cual, T=Yt-Yc, es decir, en todas las unidades t
actúa añadiendo un valor constante, T, a un valor de base Yc(u). Este supuesto está
implícito en el de unidades homogéneas, ya que si Yt(u1)=Yt(u2) y Yc(u1)=Yc(u2),
entonces T=Yt(u1)-Yc(u1)=Yt(u2)-Yc(u2). Por esto se puede considerar que el supuesto del
efecto constante es una suavización del de unidades homogéneas.
Por sí sólo el efecto del supuesto constante no permite afirmar que el efecto
prima facie y el efecto verdadero sean iguales. Veamos: el efecto verdadero se define
como T=Yt(u)-Yc(u) si se cumple el supuesto de efecto constante. El efecto prima facie
se define como Tpf=ε(Yt|S=t)-ε(Yc|S=c). Como Yt(u)=T+Yc(u) y aplicando el operador
esperanza matemática tenemos, bajo la condición de que S=t, ε(Yt|S=t)=ε((T+Yc)|S=t).
En el segundo término, como T es el efecto constante, resulta ε(Yt|S=t)=T+ε(Yc|S=t).
Sustituyendo en el efecto prima facie, Tpf=T+ε(Yct|S=t)-ε(Yc|S=c). En esta expresión el
segundo sumando del término de la derecha sólo es igual a cero cuando se cumple el
supuesto de independencia.

J. L. Gaviria 9
Métodos de Investigación en Educación.

2.- Consecuencias del modelo.


De todo lo anterior se deduce que la más importante consecuencia de este
modelo es que sólo podemos hacer inferencias causales utilizando el procedimiento
estadístico, si se cumple el supuesto de independencia. Sin él no es posible la inferencia
causal. En segundo lugar, aunque se trata como los anteriores de un supuesto
incontrastable, su mantenimiento reposa sobre una base ajena al propio proceso que se
está estudiando, y la seguridad de su cumplimiento es independiente del problema que
se estudia, lo que nos da el mismo grado de seguridad de su cumplimiento sea cual sea
nuestro objeto de estudio.
Por ejemplo, supongamos que hemos adoptado la solución científica al problema
fundamental de la inferencia causal. En esa solución son posibles dos vías: por una parte
podemos aceptar la estabilidad temporal y la transitoriedad causal como supuestos
básicos, o por otra, la homogeneidad de las unidades de análisis. Supongamos que
aceptamos la última vía. Esta vía es más o menos segura en función del problema a
tratar. Por ejemplo, si estamos estudiando el efecto de la temperatura sobre la
conductividad de los metales, para poder inferir relaciones causa-efecto, suponemos que
dos barras metálicas distintas son iguales en todos los extremos importantes para el
experimento. Ese supuesto puede ser razonable en el ejemplo propuesto, y el grado de
seguridad del experimento descansa sobre la profundidad de nuestro conocimiento de la
composición de las barras. Pero si queremos estudiar el efecto del método de enseñanza
de la lectura sobre el rendimiento lector, está claro que ese mismo supuesto es
insostenible.
Por el contrario en la solución estadística el cumplimiento del supuesto de
independencia descansa sobre el método de aleatorización empleado en la asignación de
los distintos tratamientos, y es independiente de cuál sea el problema sustantivo. Da lo
mismo que se trate de estudiar los efectos del método de lectura sobre el rendimiento
lector, que el efecto de la dieta sobre el peso de los pollos de granja. El que se cumpla o
no de hecho el supuesto de independencia, es incontrastable en cualquier caso, pero la
seguridad de nuestras conclusiones sólo depende del método o dispositivo aleatorio
empleado, y ese no cambia de un problema a otro.
Pues bien, si tal es la importancia de la aleatorización en la garantía del
cumplimiento del supuesto de independencia, ¿Quiere decir eso que sólo en el método

J. L. Gaviria 10
Métodos de Investigación en Educación.

experimental reside la posibilidad de establecer relaciones causales? ¿No es posible la


inferencia causal fuera del método experimental? Como en muchas ocasiones la respuesta
es una cuestión de grado. Desde luego la inferencia causal descansa sobre los supuestos
que hemos mencionado.
Cuando acudimos a diseños cuasi-experimentales o a diseños ex-post-facto,
estamos sustituyendo el método de aleatorización por nuestro conocimiento del objeto
de nuestro estudio. Eso es lo que tienen en común los procedimientos tales como el
análisis de covarianza, con los diseños ex-post-facto, y con modelos como el path
analysis y las ecuaciones estructurales. Podemos hacer inferencias causales siempre que
tengamos la seguridad de que las covariables elegidas, por ejemplo, son las que
garantizan que una vez eliminados sus efectos se cumple ε(Yt|S=t)=ε(Yt) y
ε(Yc|S=c)=ε(Yc). Naturalmente, si esto fuese cierto, habríamos logrado el cumplimiento
del supuesto de independencia sin la utilización de un dispositivo de aleatorización.
Pero es obvio que nunca podrá contrastarse este extremo, por lo que los dispositivos de
control estadístico, siempre descansarán sobre indicios indirectos, sobre la seguridad
que podamos tener de que las elegidas son las covariables fundamentales, sobre el
convencimiento moral en suma, y por tanto sobre una cierta seguridad subjetiva, que se
aleja de la objetividad que proporciona el propio método experimental. Esa también es
la grandeza y la miseria de los modelo estructurales. Las inferencias causales que se
establecen en ellos tienen toda la fuerza que nuestras teorías pueden aportar. Y nunca se
resaltará lo suficiente este extremo, que se menciona muchas veces pero que raramente
se toma en serio en la investigación ordinaria.
Todas estas consideraciones no tienen por qué hacernos desistir del uso de los
diseños cuasi-experimentales o incluso de los diseños ex-post-facto. Si una cosa queda
clara en esta exposición, es que siempre, las inferencias causales descansarán sobre
supuestos incontrastables, tanto en los diseños experimentales como en los
cuasi-experimentales y en los ex-post-facto. Y eso no elimina la fecundidad del trabajo
científico. Esa inseguridad de raíz es una característica propia del conocimiento
humano, y ésta es una afirmación en la que coinciden hoy todos los filósofos de la
ciencia. Desde este punto de vista, la diferencia entre los distintos tipos de diseños es
una cuestión del grado de confianza que podemos tener en que se cumplen los supuestos
sobre los que descansa.
Como ya hemos señalado la superioridad del dispositivo aleatorio en los
experimentos reside en que el cumplimiento del supuesto de independencia no depende
más que del procedimiento de aleatorización, mecanismo que es ajeno al propio
problema bajo estudio, mientras que los cuasi-experimen-tales y los ex-post-facto se
sustituye dicho mecanismo por un progresivo conocimiento de la estructura del
problema a estudiar. Se transfiere la seguridad de nuestras inferencias desde el
impersonal y objetivo método de aleatorización hacia unas teorías o conocimientos
dependientes del tema de estudio.
Siempre que esto se tenga muy presente las inferencias causales en este tipo de
diseños son perfectamente lícitas y poseedoras de estatuto científico.
Un punto de vista similar, basado en el mantenimiento de otro supuesto
denominado ‘ignorabilidad fuerte’, es asumido por ROSENBAUM y RUBIN (1983a,
1983b, 1984a, 1984b, 1985a 1985b). El problema de la inferencia causal en estudios
observacionales es tratado por RUBIN (1974, 1977, 1978) por ROSENBAUM
(1984a,1984b, 1984c) y por HOLLAND y RUBIN (1980, 1983).
Hay otra consecuencia de este modelo. Supongamos que tenemos formados
cuatro grupos de sujetos. Los llamaremos A00, A01 ,A10 ,A11 . El primer subíndice indica

J. L. Gaviria 11
Métodos de Investigación en Educación.

si los sujetos de ese grupo sobrevivirían a la aplicación de t, y el segundo a la aplicación


de c. Por tanto el primer grupo es el de los sujetos que nunca sobrevivirían, y el último
el de aquéllos que siempre lo harían. Con un grupo suficientemente grande, la
proporción que representa cada grupo coincide con la probabilidad de que un sujeto
extraído al azar pertenezca a cada grupo. Cuando P(A10 )=1 y P(A01 )=0, estamos
entonces en el caso de la conjunción constante de Hume. Mientras que cuando estas
probabilidades sean valores comprendidos estrictamente entre 0 y 1, tenemos el caso de
la causalidad probabilística, que coincide con la no homogeneidad de las unidades
de análisis, y con el rechazo de la hipótesis nula de Fisher.
Es realmente importante hacer notar cómo en la investigación educativa nos
encontramos en la mayor parte de los casos con investigaciones que están incluidas
dentro de este paradigma de causalidad probabilística.
Aunque este modelo no representa un método para determinar qué son causas y
qué no lo son sino más bien un esquema de cómo es el tamaño del efecto causal, algo
como hemos visto de naturaleza siempre relativa, tiene la gran virtualidad de que nos
permite vislumbrar el alcance y las limitaciones de nuestras aseveraciones causales,
incluso exactamente en aquéllos casos en los que nos encontramos no en un contexto
experimental, sino ex-post-facto. Es otra forma más de insistir en la importancia de la
teoría en la investigación educativa.

J. L. Gaviria 12
Métodos de Investigación en Educación.

3.- Acerca de la naturaleza de las causas


Hemos repetido muchas veces que sólo pueden establecerse relaciones causales
en los experimentos, y nunca en los estudios ex-post-facto, y pocas veces o con muchas
precauciones en los cuasi-experimentales. Podemos entender en estas afirmaciones, que
dado un cierto efecto Y, y una cierta causa X, si esa causa no es una variable
manipulable, su estatuto como causa no puede asegurarse científicamente. No podemos
entonces estar seguros de que X es causa de Y, porque indudablemente podría ocurrir
que Y fuese causa de X.
Pero este punto de vista pone en duda, no la naturaleza causal misma de las
variables, sino simplemente la posibilidad de su conocimiento. El punto de vista de
HOLLAND (1986) es mucho más radical. Si una variable es un atributo, no puede
nunca, bajo ninguna circunstancia ser considerada una causa. Es más, no sólo no
puede ser considerada causa, sino que no puede ser causa. Por lo tanto, cuando en un
estudio observacional o ex-post-facto, todas las variables son atributos, no es que no
podamos establecer relaciones causales, sino que no hay causas ni efectos. Afirmación
esta última que es por supuesto mucho más radical y polémica.
Aunque aparentemente el razonamiento de HOLLAND es indiscutible, presenta
sin embargo algunos puntos débiles. En primer lugar, HOLLAND, aunque utiliza la
terminología experimental para presentar su desarrollo, admite sin embargo la posibilidad
de inferencia causal en los estudios observacionales en los que no se cumple estrictamente
la aleatorización. Y esa posibilidad deriva directamente de la condición que algo debe
cumplir para que pueda ser considerada como una causa. “Causas son sólo aquellas cosas
que pueden, en principio, ser tratamientos en experimentos.”
El matiz ‘en principio’ se refiere a que esa posibilidad físico-material exista, sin
tener en cuenta condicionamientos éticos, morales o económicos. Se refiere a los
‘experimentos hipotéticos’. Dado que no siempre es posible la actualización de los
experimentos potenciales, en ocasiones el investigador tiene que esperar a que tenga
lugar un ‘experimento natural’. HOLLAND afirma textualmente: “Creo que la noción
de causa que opera en un experimento y en un estudio observacional es el mismo. La
diferencia está en el grado de control que un experimentador tiene sobre el fenómeno
bajo investigación comparado con el que tiene un observador. En el modelo de RUBIN

J. L. Gaviria 13
Métodos de Investigación en Educación.

esto se expresa por la distribución conjunta de S con Yt e Yc. El control total puede hacer
a S independiente de Yt e Yc”. (HOLLAND (1986, p. 954)).
En los experimentos naturales ocurre ‘como si’ la naturaleza asignase al azar los
distintos valores de S a los sujetos. Y ¿Por qué un atributo no puede ser causa dentro de
este modelo? La principal razón es que el efecto causal se define como la diferencia
T=Yt(u)-Yc(u). Esto es, la diferencia que se obtendría en una unidad de análisis entre el
valor de la variable de respuesta correspondiente al tratamiento t y el valor de la
variable de respuesta correspondiente al tratamiento c. Si los valores t y c fuesen dos
atributos distintos, como por ejemplo, sexo masculino y sexo femenino, la unidad u ya
no sería la misma, por lo que no puede definirse el efecto causal. Naturalmente, el
sostener esto hasta las últimas consecuencias, supone ser capaz de determinar qué es un
atributo y qué es un tratamiento potencial.
También es preciso en definitiva, poder determinar cuáles son las características
que definen lo invariante de un sujeto y cuáles son aspectos contingentes, ya que podría
argüirse que el sujeto que experimentó el tratamiento t, es otro distinto del que sería si
hubiese experimentado el tratamiento c. En cualquier caso aunque en algunas ocasiones
la diferenciación pueda aparecer como clara y evidente, si tratamos de considerar las
relaciones de causalidad desde un punto de vista amplio, nos resulta muy difícil negar la
naturaleza causal a una afirmación como:
“El sol es la causa de que los planetas transiten por sus órbitas respectivas”.
En este caso, el sol realmente mantiene a los planetas en sus órbitas, pero,
¿Admitiría HOLLAND, o mejor dicho, podríamos nosotros admitir, utilizando el
criterio de HOLLAND, que el sol es la causa de la estabilidad orbital? Es indudable que
no podemos pensar en un tratamiento alternativo para los planetas, es decir, no podemos
quitar al sol del sistema solar. Pero, ¿Es que es ‘per se’ imposible, o simplemente
‘difícil’, aunque posible como experimento hipotético?
Lo que parece claro es que la eliminación del sol no cambia la naturaleza
entitativa de los planetas, por lo que la presencia o ausencia del sol no parece un
atributo, siendo por tanto una causa potencial. Se podría añadir en apoyo a este
razonamiento que precisamente la no manipulabilidad astronómica es lo que ha
retrasado en la historia el reconocimiento de la masa del sol y de los planetas como
causa de los movimientos planetarios. Pero obsérvese que con el criterio de
HOLLAND, no es que no puedan descubrirse las relaciones causales, es que aquello
que no es manipulable no es una causa.
Desde otro punto de vista, alguien podría aducir que la naturaleza entitativa de
los planetas se define precisamente por su relación con el sol, por lo que la hipotética
eliminación del mismo cambiaría su naturaleza. Por supuesto que la réplica consiste en
afirmar que la única naturaleza de los planetas que nos interesa es aquella que afecta a
su movimiento espacial, es decir, nos interesa su masa.
En el hipotético experimento cósmico, la eliminación del sol cambiaría muchas
cosas en los planetas, por ejemplo supondría la desaparición de la vida de la Tierra, el
enfriamiento de Venus, etc. Pero, a los efectos de nuestro experimento, ¿Supondría eso
un cambio importante? La respuesta es no. Sólo aquello que cambiase la masa o las
distancias dentro del sistema solar afectaría al resultado del experimento. Pues bien, esta
respuesta podría trasladarse a otros casos. El cambiar un atributo a un sujeto es algo
difícil de concebir, pero no imposible. El sexo es un atributo, y aunque es difícil pensar
en un experimento con cambio de sexo de los sujetos, no por ello es impensable un
experimento hipotético. El argumento de que eso supondría cambiar la unidad de
análisis tiene la misma respuesta que el experimento planetario: un cambio sólo sería

J. L. Gaviria 14
Métodos de Investigación en Educación.

importante si afectase en algo a alguna de las características que intervienen en el


mecanismo de acción causal, como la masa en el caso de los planetas.
De cualquier forma no podemos rechazar sin más ni más el argumento de
HOLLAND, máxime cuando se trata de una consecuencia lógica de todo el modelo. Sin
embargo, a pesar de todo nos resulta difícil admitir sin réplica esa idea. Si así lo
hiciéramos, nos veríamos obligados por ejemplo a aceptar que la inteligencia, no es una
de las causas del rendimiento académico, mientras que sí lo es el tiempo de
escolarización. Otras cosas seguramente nos importarían menos, pero ésta es una
consecuencia demasiado fuerte para que no nos haga reflexionar sobre los posibles
puntos débiles de la argumentación.
Tenemos que centrarnos en la idea fundamental del argumento, esto es, los
atributos no son causas porque cambiar uno de esos atributos sería cambiar al sujeto.
Por ejemplo, si queremos comprobar el efecto del sexo sobre el rendimiento, tendríamos
que estudiar T=Ya(u)-Yb(u), siendo a=masculino y b=femenino. Pero dado que u es un
sujeto, no podemos pensar en obtener su puntuación para el caso A(u)=a y A(u)=b.
Esto tiene dos interpretaciones. En primer lugar, podemos pensar que para
cambiar un atributo, tenemos que cambiar de sujeto porque no disponemos ahora de otra
forma de conseguir el atributo alternativo. Los valores a y b son valores de la función
A(u), por lo que para pasar de un valor a otro hay que cambiar el argumento de la
función, lo que supone cambiar de sujeto. Si entendemos el argumento así, estamos
hablando de una dificultad práctica o técnica. Es decir, dado que no sabemos en la
actualidad cómo cambiar un cierto atributo en un sujeto, la única forma de conseguir el
atributo alternativo es cambiar de sujeto.
Así entendido, resulta que el matiz que introduce HOLLAND de que la posible
causa debe ser ‘en principio’ substituible por la causa alternativa, es aplicable a este
caso. Tal vez la actual tecnología no permita cierto cambio de un atributo, pero es
hipotéticamente posible que la tecnología del futuro permita dicha modificación. Ese
atributo sería desde ahora mismo un candidato a su consideración como causa.
En una segunda interpretación, no debemos cambiar un atributo, porque si
consiguiéramos hacerlo, el sujeto que obtendríamos ya no sería el mismo, por lo cual
estaríamos incumpliendo la definición de tamaño del efecto que exige que las causas
alternativas se apliquen sobre la misma unidad de análisis. Esta forma de interpretación
es la que suscita más consideraciones lógicas. Debemos preguntarnos qué es en realidad
una unidad de análisis. Si nos atenemos al modelo, una unidad de análisis u, es un
elemento que forma parte de un conjunto U. Al definir el modelo, estamos
desarrollando una teoría, es decir, una estructura matemática. Desde este punto de vista,
u es una entidad matemática definida a priori, y por lo tanto en el acto de la definición
debemos indicar cuales son las propiedades invariantes que definen a un elemento u, y
qué propiedades son transitorias. Y esa definición es un acto arbitrario que no está
sujeto a más requisitos que la necesidad de que los hechos no contradigan la teoría.
Unos pocos ejemplos tomados de las matemáticas y la física seguramente ayudarán a
aclarar nuestra posición.
En una geometría cartesiana en un espacio de dos dimensiones, la unidad elemental
es un punto. Las propiedades que definen a un punto son sus coordenadas respecto a la
base de ese espacio. En un espacio así definido es perfectamente posible hablar de
cualquier figura geométrica como un conjunto de puntos que guardan entre sí
determinadas relaciones espaciales. En esta geometría, si un punto dado cambia sus
coordenadas, ya no es el mismo punto, es otro distinto, porque lo que define la identidad de
un punto es precisamente su posición en el plano. Y sin embargo a pesar de ello, podemos

J. L. Gaviria 15
Métodos de Investigación en Educación.

desarrollar toda una geometría utilizando un punto que se mueve por el plano. Ese punto
no tiene masa, ni dimensiones, ni ninguna propiedad que nos permita reconocer en los
distintos instantes que aunque cambia su posición en el espacio es idéntico a sí mismo. Y
las figuras geométricas aparecen como las trayectorias que describe por el espacio ese
punto hipotético. La identidad de esa abstracción matemática es una propiedad asignada
por nosotros arbitrariamente.
Supongamos ahora que estamos desarrollando una teoría del movimiento.
Además del espacio cartesiano definido anteriormente, la unidad elemental es un punto
sin masa que se mueve por el espacio, y que por tanto está dotado de velocidad. Es
decir, su posición cambia con el tiempo. Antes de seguir queremos resaltar el hecho de
que este punto no es más que una abstracción. ¿Qué es lo que mantiene la identidad de
ese punto que no está dotado de más propiedades que la de una posición que cambia con
el tiempo? ¿Cómo podemos desarrollar una teoría acerca de un objeto que no tiene
identidad?
Pensemos ahora en la dinámica teórica. Un espacio cartesiano en el que el
elemento de análisis es un punto dotado de masa y cuya posición cambia con el tiempo.
Las relaciones entre la masa y la velocidad de cada unidad de análisis determinan su
cantidad de movimiento, su inercia, etcétera. En cada uno de los tres ejemplos que
hemos mencionado, el elemento de análisis es una abstracción a la que se le atribuyen
determinadas propiedades. Una pregunta importante a este respecto es si esas unidades
de análisis que se definían en cada una de las tres teorías representan bien a los
elemento de la realidad que dicha teoría pretende modelizar. La respuesta es que no los
representan bien, pero los representan adecuadamente. No los representan bien porque
el objetivo de definir las unidades de análisis en cada teoría no es representar completa
y fielmente los elementos de la realidad que se está modelizando. Pero los representan
adecuadamente porque se trata de abstracciones que toman de los elementos de la
realidad precisamente aquellas características que son importantes a la hora elaborar el
modelo. Es verdad que no existen en la realidad sensible objetos que no tengan
dimensiones, que sólo tengan posición en el espacio. Pero también es verdad que en esa
realidad sensible no existen ni triángulos ni circunferencias, existen objetos circulares,
pero no hay circunferencias puras. Lo que no resta utilidad a la geometría. Lo mismo
puede decirse de la dinámica y de cualquier otra teoría matemática.
Pues bien, volvamos a las unidades de análisis de una teoría de la inferencia
causal. Lo primero que deberíamos preguntarnos es cuáles son las propiedades que
definen a los elementos de esa teoría. Podemos decir que una unidad de análisis es un
ente que tiene ciertas propiedades, por ejemplo una determinada puntuación de
inteligencia y una determinada situación socio-familiar. Las relaciones entre el nivel
socio-cultural y la inteligencia determinan el rendimiento escolar. Como esta unidad de
análisis es una abstracción, puedo proponer el caso de que esa misma unidad de análisis
tenga otro valor distinto de la variable inteligencia. Y por eso no cambia la identidad de
la unidad de análisis, ya que por definición le asignamos la misma identidad. Volviendo
a uno de los ejemplos, podemos decir que si el punto A tiene la masa X y la velocidad Y,
su cantidad de movimiento sería XxY, mientras que si A tuviera una masa X' y la misma
velocidad, su cantidad de movimiento sería X'xY. Sin embargo es cierto que en la
realidad que conocemos, un mismo cuerpo no puede tener dos masas distintas. Pero no
por eso decimos que por ejemplo la Teoría de la Gravedad no pueda ser una teoría
causal.
Y esto último nos lleva a otro aspecto del problema, a saber, las relaciones entre
una teoría y la realidad que modeliza, es decir, entre una teoría y un sistema. Es por lo

J. L. Gaviria 16
Métodos de Investigación en Educación.

tanto un problema de semántica. Desde este punto de vista, el modelo de RUBIN


desarrollado por HOLLAND es una teoría contra-fáctica. O al menos es una teoría que se
fundamenta en condicionales contra-fácticos. Según FERRATER MORA (1980, p. 577)
‘Un condicional contra-fáctico (que podemos llamar simplemente un ‘contra-fáctico’) es
definido como un enunciado condicional en el cual interviene la noción de posibilidad,
expresada gramati-calmente por la introducción del subjuntivo. Ejemplos de
contra-fácticos son:
“Si Julio Cesar no hubiera cruzado el Rubicón, otra hubiera sido la suerte de
Roma.
Si el vaso se hubiese caído, se habría roto.”
Como señala GLYMOUR (1986), si la teoría desarrollada por HOLLAND es
una teoría contra-fáctica, sus enunciados deben enmarcarse en una teoría lógica que
contemple los condicionales contra-fácticos. De hecho, en la definición de tamaño del
efecto, que es la definición central del modelo, comparamos el valor que tendría la
variable de respuesta si la causa fuese t (subjuntivo) con el valor que tendría si la causa
fuese c (subjuntivo). Por lo tanto el problema fundamental de la inferencia causal visto
ahora desde la óptica de las teorías contra-fácticas tiene la misma solución en cuanto a
su posibilidad que las propias teorías contra-fácticas en general. Para centrar en ese
entorno al modelo de RUBIN, GLYMOUR utiliza la teoría debida a STALNAKER
(1984).
Supongamos que hay un conjunto de mundos posibles, en los que cada sentencia
que no sea contra-fáctica sea verdadera o falsa. Puede entenderse que estos mundos son
entidades matemáticas del mismo tipo que un espacio de n-dimensiones. En ese
conjunto de mundos posibles se define una relación de proximidad, de tal forma que
para cada mundo w y cada posible condicional A, el mundo más próximo a w es aquél
en el que A es cierto. Entonces para cualquier sentencia X e Y, la expresión “Si X fuese
cierto, entonces se daría el caso Y” que es un condicional contra-fáctico, tendría el valor
de verdad en el mundo w si en el mundo más próximo a w en el que X fuese cierto, Y
fuese también cierto.
Hemos descrito una forma de asignar valores de verdad a los condicionales
contra-fácticos. Según LEWIS (1973, 1983) las expresiones causales son condicionales
contra-fácticos, ya que decimos “X causa Y si y sólo si X ocurre e Y ocurre y si X no
hubiese ocurrido, entonces Y no habría ocurrido”.
Para GLYMOUR (1986, p.965) esta expresión puede formularse en términos de
semántica contra-fáctica como “X causa Y si y sólo si X es verdad en el mundo actual e
Y es verdad en el mundo actual y en el mundo posible más próximo al actual en el que X
no es verdad, Y no es verdad”. De esta forma podemos asignar valores de verdad a las
expresiones causales, sin tener que limitarnos a contemplar como causa sólo los
posibles tratamientos experimentales.
La pega de la explicación contra-fáctica de la causalidad es que hacemos alusión
a mundos no observables. Pero eso es en el fondo el problema fundamental de la
inferencia causal tal y como lo presenta HOLLAND. ¿Y cómo es posible que seamos
capaces de establecer inferencias causales a pesar de todo? La respuesta es que somos
capaces de inferir verdades contra-fácticas, porque como indica GLYMOUR (1986)
establecemos supuestos que contrastamos unos contra otros de forma indirecta. Ese es
en realidad el papel que juegan los supuestos de la solución científica y de la, para
nosotros más importante, solución estadística.
Nos hemos extendido bastante al tratar el tema de la posibilidad de que los
atributos sean considerados como causas de los efectos observados. Posiblemente en el

J. L. Gaviria 17
Métodos de Investigación en Educación.

intento de aclarar esa cuestión haya influido el hecho de que en nuestro ámbito de
investigación, variables con un poder explicativo tan grande como la inteligencia sean
atributos. Pero pensando en variables de otros ámbitos, ¿Cómo podemos negar la relación
causal entre la carencia de cierta porción de DNA y el padecimiento de la hemofilia? Es
indudablemente una cuestión de lenguaje, pero es difícil resistirse a la tentación de
considerar que existe una relación causal. Pero es que ese mismo tipo de relaciones existen
entre las capacidades de cualquier tipo y los rendimientos. Podríamos limitarnos a
considerar simplemente las distribuciones conjuntas y las distribuciones condicionales,
pero algo nos impulsa a dar un paso más allá de estas consideraciones. Y un argumento
que empuja en la misma dirección aparece cuando consideramos ciertas cadenas causales
que son poco claras, en las que algunas variables pueden adoptar, según el punto de vista,
el rol de atributos o el rol de variables manipulables ‘en principio’.
Podemos considerar que en el desarrollo de los párrafos anteriores hemos
presentado una alternativa de la explicación causal digna de ser tenida en cuenta.
Como conclusiones de todas las consideraciones anteriores podríamos enunciar
las que siguen, aunque probablemente no en el mismo orden en que se han tratado.
En primer lugar, el establecimiento de relaciones causales supone la
comparación de una causa con otra. La determinación del tamaño del efecto supone
establecer el efecto de una causa con relación al efecto de otra.
En segundo lugar, no pueden establecerse relaciones causales sin asumir algún
supuesto que es en sí mismo incontrastable. De unas soluciones a otras varían los supuesto
asumidos, pero siempre hay que adoptar alguno de ellos.
En tercer lugar, cualquier cosa que pueda ser un tratamiento en un experimento
puede ser una causa, pero existen poderosos argumentos que permiten asignar el papel
de causas a variables atributivas. Este es un punto abierto a la discusión, y cualquier
postura puede ser justificada.
En cuarto lugar, la solución estadística al problema de la inferencia causal
supone asumir el supuesto de independencia. Ese supuesto es altamente razonable
cuando los tratamientos se asignan al azar a cada uno de las unidades de análisis, ya que
en ese caso la mayor o menor confiabilidad en el cumplimiento del mismo descansa
sobre la eficacia del método de aleatorización. Pero este método no es el único que
permite asumir el supuesto de independencia. El conocimiento del fenómeno a estudiar
puede permitir asegurar el cumplimiento del mismo, sólo que en este caso la seguridad
descansa sobre el grado de conocimiento que podamos tener del fenómeno a estudiar.
Esto permite establecer inferencias causales en los estudios observacionales.
Por último, no pueden identificarse los estudios correlacionales con los estudios
observacionales. En los primeros se trata de solucionar estadísticamente un problema de
inferencia de los parámetros asociativos. En los segundos se utiliza un esquema causal
en el que el mecanismo de aleatorización se ha sustituido por un cierto control
estadístico, que presupone el conocimiento de un cierto fenómeno, es decir, la
existencia de una teoría, cuya consistencia es la garantía de que se cumple el supuesto
de independencia.

J. L. Gaviria 18
Métodos de Investigación en Educación.

4.- Referencias
Ferrater Mora, J. (1980) Diccionario de Filosofía Alianza, Madrid
Glymour, C. (1986) Comment. Statistics And Metaphysics Journal Of The
American Statistical Association, Vol. 81, Nº 396, Pp. 964-966
Holland, P. W. (1986) Statistics And Causal Inference Journal of the American
Statistical Association, Vol. 81, Nº 396, Pp. 945-960
Holland, P.W. (1993) Probabilistic Causation Without Probability Research
Report nº 93-29 Educational Testing Service
Holland, P.W. y Rubin, D.B. (1980) Causal Inference In Prospective And
Retrospective Studies Conferencia leída en la ‘Jerome Cornfield Memorial Session’ del
American Statistical Association Annual Meeting.
Holland, P.W. y Rubin, D.B. (1983) On Lord's Paradox En Wainer, H. y
Messick, S. (Eds.) Principals Of Modern Psychological Measurement Lawrence
Erlbaum, Hillsdale, N.J.
Hume, D. (1740/1888) A Treatise of Human Nature. (L. A. Selby-Bigge, Ed. )
Oxford University Press. London
Hume, D. (1748) An Inquiry Concerning Human Understanding.
Lewis, D. (1973) Counterfactuals Harvard University Press, Cambridge, Ma.
Lewis, D. (1983) Philosophical Papers (Vol. 2) Oxford University Press,
Oxford, U.K.
Rosenbaum, P. R. (1984a) From Association To Causation In Observational
Studies: The Role Of Tests Of Strong Ignorable Treatment Assignment Journal Of The
American Statistical Association, VOL. 79, Pp. 41-48
Rosenbaum, P. R. (1984b) The Consequences Of Adjustment For A Concomitant
Variable That Has Been Affected By The Treatment Journal Of The Royal Statistical
Society, Ser. A, VOL. 147, Pp. 656-666
Rosenbaum, P. R. (1984c) Conditional Permutation Tests And The Propensity
Score In Observational Studies Journal Of The American Statistical Association, Vol.
79, Pp. 565-574

J. L. Gaviria 19
Métodos de Investigación en Educación.

Rosenbaum, P. R. y Rubin D. B. (1983b) Assessing Sensitivity To An


Unobserved Binary Covariate In An Observational Study With Binary Outcome Journal
Of The Royal Statistical Society, Ser. B, Vol. 45, Pp. 212-218
Rosenbaum, P. R. y Rubin, D. B. (1983a) The Central Role Of The Propensity
Score In Observational Studies For Causal Effects Biometrika, Vol. 70, Pp. 41-45
Rosenbaum, P. R. y Rubin, D. B. (1984a) Discussion Of 'On The Nature And
Discovery Of Structure' By J. W. Pratt And R. Schlaifer' Journal Of The American
Statistical Association,, Vol. 79, Pp. 26-28
Rosenbaum, P. R. y Rubin, D. B. (1984b) Reducing Bias In Observational
Studies Using Subclassification On The Propensity Score Journal Of The American
Statistical Association, Vol. 79, Pp. 516-524
Rosenbaum, P. R. y Rubin, D. B. (1985a) Constructing A Control Group Using
Multivariate Matched Sampling Methods That Incorporate The Propensity Score The
American Statistician, VOL. 39, Pp. 33-38
Rosenbaum, P. R. y Rubin, D. B. (1985b) The Bias Due To Incomplete
Matching Biometrics, VOL. 41, Pp. 103-116
Rubin, D. B. (1974) Estimating Causal Effects Of Treatments In Randomized
And Nonrandomized Studies Journal Of Educational Psycholoy, VOL. 66, Pp. 688-701
Rubin, D. B. (1977) Assignment Of Treatment Group On The Basis Of A
Covariate Journal Of Educational Statistics, VOL. 2, Pp. 1-26
Rubin, D. B. (1978) Bayesian Inference For Causal Effects: The Role Of
Randomization The Annals Of Statistics, VOL. 6, Pp. 34-58
Rubin, D. B. (1980) Discussion Of 'Randomization Analysis Of Experimental
Data: The Fisher Randomization Test' By D. BASU Journal Of The American Statistical
Associetion, VOL. 75, Pp. 591-593
Stalnaker, R. (1984) Inquiry Bradford Books, Boston, Ma.
Suppes, P.C. (1970) A Probabilistic Theory of Causality North Holland,
Amsterdam

J. L. Gaviria 20

También podría gustarte