Está en la página 1de 18

Hacia una teoría

unificada de la causalidad

James Mahoney

Universidad Northwestern, Evanston, Illinois

En la investigación comparativa, los analistas conceptualizan la causalidad de


formas opuestas cuando persiguen la explicación en casos particulares
(investigación orientada a casos) frente a grandes poblaciones (investigación
orientada a poblaciones). En la investigación orientada a casos, entienden la
causalidad en términos de causas necesarias, suficientes, INUS y SUIN. En
cambio, en la investigación orientada a la población, entienden la causalidad como
efectos causales medios. Este artículo explora si es posible traducir el tipo de
lenguaje causal que se utiliza en la investigación orientada a casos al tipo de
lenguaje causal que se utiliza en la investigación orientada a la población (y
viceversa). El artículo sugiere que tal traducción es posible, porque ciertos tipos de
causas INUS se manifiestan como variables que exhiben efectos parciales cuando
se estudian en la investigación orientada a la población. El artículo concluye que la
concepción de la causalidad adoptada en la investigación orientada a casos es
apropiada para el nivel poblacional, mientras que la concepción de la causalidad
utilizada en la investigación orientada a la población es valiosa para hacer
predicciones ante la incertidumbre.

Los analistas comparativos utilizan métodos distintos y conceptualizan la


causalidad de maneras contrastadas cuando llevan a cabo explicaciones en casos
particulares frente a grandes poblaciones. Cuando analizan casos particulares, los
comparativistas tratan de identificar los valores específicos de las variables que
posibilitaron y/o generaron los resultados de interés. Persiguen un modo de
explicación genético y secuencial que se implementa en parte a través de la prosa
narrativa. En cambio, cuando los comparativistas estudian grandes poblaciones,
tratan de estimar los efectos medios de las variables independientes de interés.
Llevan a cabo análisis estadísticos y presentan los resultados como coeficientes
que se aplican a las poblaciones en su conjunto y no a observaciones particulares.

Estos dos enfoques pueden denominarse, por conveniencia, investigación


orientada a casos y orientada a la población. Los investigadores orientados a
casos concretos tratan de identificar las causas de determinados resultados en
casos específicos. Pueden encontrar patrones causales que se apliquen en
general, pero su principal preocupación es la causalidad en los casos específicos
analizados. Por el contrario, los investigadores orientados a la población tratan de
identificar efectos causales típicos en poblaciones globales. A veces pueden
investigar si un caso concreto sigue un patrón casual general, pero su interés
principal es decir algo sobre el patrón poblacional más amplio.
Para ilustrar estas diferencias, consideremos la investigación sobre la
democratización. Tanto los investigadores orientados a los casos como los
orientados a la población están interesados en la pregunta: "¿Qué causa la
democracia?". Sin embargo, normalmente abordan esta cuestión de formas
diferentes. El investigador orientado a casos concretos la aborda preguntándose
qué causó la democracia en determinados casos, como un conjunto de países
democráticos y no democráticos homogéneos en cuanto a variables contextuales.
Es habitual, por ejemplo, preguntarse por qué se produjo la democracia en
algunos países de una región determinada, pero no en otros (por ejemplo, Yashar,
1997) o en una época histórica concreta (por ejemplo, R. B. Collier, 1999). El
analista puede explicar los casos investigados sin poder generalizar esta
explicación a un amplio abanico de lugares y épocas. El investigador orientado a
la población, por el contrario, aborda la cuestión preguntándose por los efectos
parciales de las variables independientes de interés sobre la distribución de la
democracia en un gran número de casos. Por ejemplo, la investigación
transnacional sobre la democracia a menudo se preocupa por producir buenas
estimaciones del efecto medio de variables como el desarrollo económico (por
ejemplo, Londregan y Poole, 1996) o el número de partidos políticos (por ejemplo,
Mainwaring, 1993). En estos estudios, el analista puede informar con precisión de
los efectos típicos de determinadas variables independientes sin proporcionar una
explicación exhaustiva de la democracia para ningún caso concreto.

Tal vez la mayoría de los comparativistas crean que tanto las formas de
investigación orientadas a casos como las orientadas a la población son dignas de
estudio. Sin embargo, no se aprecian bien sus numerosas diferencias, lo que
fomenta los malentendidos (Mahoney y Goertz, 2006). De estas diferencias, quizá
la más básica se refiere a las concepciones de causalidad. Los enfoques
orientados a los casos y los orientados a la población divergen en sus
concepciones fundamentales de la causalidad, lo que deja al campo comparativo
sin una teoría unificada de la causalidad. El reto de la unificación consiste en
conciliar las afirmaciones aparentemente contradictorias de ambos enfoques sobre
la causalidad. ¿Cómo puede ser la causalidad tanto un proceso que permite o
genera resultados específicos en casos concretos como una probabilidad
estadística que opera probabilísticamente dentro de una población? Una teoría
unificada debería explicarnos por qué no hay contradicción en este punto y por
qué (y si) necesitamos interpretaciones tan aparentemente diferentes de la
causalidad a nivel de caso y a nivel de población. De hecho, debería proporcionar
las herramientas para traducir el tipo de lenguaje causal que se utiliza a nivel de
caso al tipo de lenguaje causal que se utiliza a nivel de población (y viceversa).

En este artículo exploro cómo unificar los enfoques de la causalidad orientado a


los casos y orientado a la población. La teoría de la unificación que propongo es
reduccionista: asume que los efectos causales a nivel de población se manifiestan
sólo en la medida en que los procesos causales operan en los casos individuales.
El nivel de población no presenta "propiedades emergentes" que no puedan
reducirse a (es decir, explicarse en términos de) procesos que ocurren en los
casos individuales. La causalidad a nivel de población es, por tanto,
epifenoménica; la causalidad a nivel de caso es ontológicamente anterior a la
causalidad a nivel de población. Aunque a algunos este enfoque ascendente les
parecerá obvio, el enfoque más común para lograr la unificación ha sido el
descendente: Los estudiosos intentan comprender la causalidad a nivel de los
casos individuales utilizando ideas que se aplican al nivel de la población. Como
veremos, este enfoque está plagado de problemas que se corrigen si se parte de
una comprensión firme de la causalidad a nivel de los casos individuales y luego
se amplía esta comprensión al nivel de la población.

Al desarrollar una teoría unificada de la causalidad, no exploro todas las


diferencias entre los enfoques orientados a los casos y a la población. Quizá la
más notable sea que no considero aquí cuestiones importantes relacionadas con
la temporalidad, los mecanismos causales y la transmisión de los efectos causales
a lo largo del tiempo. No obstante, las cuestiones tratadas en este artículo
proporcionan una base necesaria para la posterior explicación de estas y otras
diferencias entre los dos enfoques.

El enfoque basado en casos

Los investigadores centrados en casos concretos tratan de explicar los resultados


de casos específicos. Se plantean preguntas como: "¿Por qué los países
europeos desarrollaron regímenes liberal-democráticos, social-democráticos o
fascistas durante el periodo de entreguerras?" (Luebbert, 1991). (Luebbert, 1991);
"¿Por qué Estados Unidos proporcionó generosas prestaciones a los veteranos de
la Guerra Civil y a sus dependientes?" (Skocpol, 1992); y "¿Por qué Corea y
Taiwán, pero no Siria y Turquía, experimentaron un desarrollo económico
sostenido tras la Segunda Guerra Mundial?" (Waldner, 1999). Al responder a estas
preguntas, los investigadores intentan identificar los valores de las variables que
realmente causaron los resultados concretos en los casos específicos.

Este objetivo de investigación parece bastante sencillo. Pero, ¿qué quieren decir
concretamente los investigadores de estudios de casos cuando afirman que un
determinado valor de una variable

es la causa de un resultado concreto? Por ejemplo, ¿qué quiere decir Skocpol


(1992) cuando afirma que la democracia de patronazgo competitivo fue una causa
de las pensiones de la Guerra Civil? Hay diferentes respuestas posibles a estas
preguntas, algunas más útiles que otras.

Definiciones basadas en la probabilidad

Quizá el enfoque más común para definir la causalidad en el caso individual sea
suponer que funciona como la causalidad a nivel de la población. En este caso, la
causalidad se concibe en términos de probabilidades. Una causa es
concretamente un valor de una variable que hace más probable un resultado; una
causa aumenta la probabilidad de que se produzca un resultado. Esta definición
de causa como "aumentadora de probabilidades" procede de la teoría de la
probabilidad que sustenta la investigación orientada a la población.

Sin embargo, a nivel del caso individual, la idea de que las causas aumentan las
probabilidades plantea varios problemas. En primer lugar, las probabilidades
deben derivarse de las poblaciones. Y las causas que aumentan la probabilidad de
un resultado determinado en una población no tienen por qué aumentar la
probabilidad de ese resultado en un caso concreto. De hecho, algunos factores
que uno querría llamar "causas" de un resultado en un caso individual en realidad
disminuyen la probabilidad del resultado en una población más amplia. Los
filósofos utilizan escenarios estilizados para ilustrar esta idea, pero los estudiantes
de política comparada conocen ejemplos. Por ejemplo, aunque muchas
investigaciones sugieren que el desarrollo económico aumenta la probabilidad de
democracia (o la estabilidad democrática), durante mucho tiempo se ha
considerado una causa de la ruptura de la democracia y la aparición del
autoritarismo en Sudamérica durante los años sesenta y setenta (por ejemplo, D.
Collier, 1979; O'Donnell, 1973; véase también Mainwaring y Pérez-Liñán, 2003).
Del mismo modo, la elección de gobiernos de izquierdas y laboristas hace
históricamente menos probable, por término medio, el inicio de reformas radicales
orientadas al mercado, pero estos gobiernos han sido tratados como causa de
tales reformas en varios países en desarrollo contemporáneos (Levitsky & Way,
1998).

Es más, la propia idea de considerar la causalidad en términos de probabilidades


cuando N = 1 es problemática. A nivel de caso individual, la probabilidad ex post
(objetiva) de que se produzca un resultado específico es 1 ó 0; es decir, el
resultado se producirá o no se producirá. Este punto de vista es coherente con
casi todas las interpretaciones de las probabilidades. Así, según los enfoques de
la probabilidad frecuencial "No tiene sentido hablar de una probabilidad de caso
único... . En una interpretación frecuentista, las probabilidades son propiedades de
todo el conjunto, no de los sucesos individuales" (Appleby, 2004, p. 449). Otros
enfoques realistas que ven las probabilidades como características objetivas
también tratan las probabilidades de caso único como carentes de sentido (Milne,
1986). Del mismo modo, por diferentes razones, los subjetivistas bayesianos
rechazan la idea de las probabilidades de caso único (véase Albert, 2005). Sin
duda, la probabilidad ex ante (subjetiva) de que se produzca un resultado en un
caso determinado puede estimarse en términos de alguna fracción. Pero la
probabilidad real del resultado siempre es igual a su probabilidad ex post, que es 1
o 0. Por ejemplo, en muchos intentos, la probabilidad de que un jugador de dados
saque ojos de serpiente (1 en dos dados de seis caras) es de 1 en 36. Sin
embargo, para cualquier tirada individual, la probabilidad real de ojos de serpiente
en el momento de la tirada es de 1 en 36. Sin embargo, para cualquier tirada
individual, la probabilidad real de que salgan ojos de serpiente en el momento de
lanzar los dados es igual a 1 o 0. El resultado para el papel concreto se ve
afectado no sólo por el hecho de que cada dado tiene seis caras, sino también por
la posición inicial, la velocidad, el momento angular, etc., factores que determinan
de forma infalible y, en principio, predecible (no al azar, ni cuánticamente) si los
dados saldrán ojos de serpiente.

Podemos concretar estas ideas con un ejemplo de política comparada: la


aparición de la democracia en la India. Los estudiosos que se ocupan de esta
cuestión señalan habitualmente que la larga duración de la democracia en la India
es sorprendente teniendo en cuenta lo que sabemos sobre las probabilidades a
nivel de población (por ejemplo, Kohli, 1988, 2001; Rudolph y Rudolph, 1959;
Varshney, 1998; Waldner, 2006). Después de todo, la India tiene muchas
características (por ejemplo, pobreza, heterogeneidad étnica, desigualdad,
regionalismo) que se cree que disminuyen gravemente la probabilidad de
democracia. Sin embargo, dado que la democracia se produjo, el reto para los
investigadores de casos ha sido explicarla (en lugar de suponer que fue producto
del azar). Entre otras cosas, la mayoría de los investigadores señalan al Partido
del Congreso como promotor y estabilizador clave de la democracia. Por
supuesto, en otros contextos, partidos de masas de esta naturaleza han
desencadenado autoritarismos estables e incluso regímenes totalitarios de larga
duración (Huntington, 1968). ¿Por qué iba a ser el partido una causa de la
democracia en la India? Curiosamente, los investigadores orientados al caso
sugieren que algunos de los mismos factores que hicieron que la democracia en la
India fuera tan subjetivamente sorprendente también explican por qué el Partido
del Congreso promovió la democracia. Así, las estructuras sociales jerárquicas y
las divisiones étnicas llevaron al Partido del Congreso a adoptar un
"funcionamiento interno basado en reglas" en el curso del movimiento nacionalista
(Varshney, 1998). La presencia de una sociedad heterogénea también animó a las
élites a incorporar al partido a agricultores medios y ricos, actores que ocupaban
una posición estratégica entre las élites terratenientes y los trabajadores sin tierra.
A su vez, el funcionamiento burocrático interno y una amplia alianza acomodaticia
hicieron que el Partido del Congreso estuviera bien preparado para liderar una
transición pacífica y sostenible a la democracia con la independencia. El punto
crucial para nosotros es que las condiciones que provocaron la democracia en la
India incluían algunos de los mismos factores que disminuyen probabilísticamente
la probabilidad de democracia en general. Sin todos estos obstáculos, es posible
que el Partido del Congreso de la India no hubiera desempeñado su papel
histórico y que el país no hubiera desarrollado un régimen democrático estable.

Definiciones de necesidad y suficiencia

En lugar de pensar en las causas a nivel de caso como aumentadores de


probabilidad, será mejor que adoptemos una orientación basada en la filosofía de
la lógica. Desde esta orientación, es común definir la causa en el caso individual
como un valor variable que es necesario y/o suficiente para un resultado. La idea
de que la causalidad debe verse como una causalidad específicamente necesaria
sigue una larga tradición que se remonta a Hume (Goertz, 2003; Lewis, 1986). El
planteamiento recoge la intuición de que una causa es algo que -cuando se
elimina de forma contrafáctica en condiciones ceteris paribus- fomenta un
resultado diferente. Por ejemplo, es famosa la frase de Moore (1966) "sin
burguesía, no hay democracia" (p. 418) para subrayar la idea de que una
burguesía fuerte e independiente era necesaria para el camino hacia la
democracia en los primeros tiempos de la modernidad. Más recientemente,
Weyland (1998) sostiene que las crisis profundas fueron necesarias para que los
líderes iniciaran planes de "choque" de ajuste económico en el mundo en
desarrollo contemporáneo; Tarrow (1989) afirma que las profundas y visibles
escisiones estructurales y las oportunidades políticas han sido causas necesarias
de los ciclos históricos de protesta; y Amsden (1992) sostiene que una distribución
relativamente equitativa de la renta ha sido necesaria para el éxito de la
industrialización tardía.

Aunque útil, este enfoque no puede dar cabida a las causas suficientes. Con
causas suficientes, la ausencia contrafactual de la causa puede no cambiar el
resultado en un caso individual y, por tanto, podría interpretarse que no ejerce un
efecto según la definición de causa necesaria.7 De hecho, existe una amplia
literatura filosófica, que también se remonta a Hume, que define la causa en
términos de suficiencia en lugar de necesidad.8 Algunos comparativistas utilizan
este enfoque, al menos implícitamente. Por ejemplo, Goldhagen (1997) sostiene
que una cultura de antisemitismo virulento fue suficiente para motivar a los
alemanes a matar judíos. No eran necesarios factores causales alternativos, como
el ascenso de los nazis y Hitler. El antisemitismo de Alemania fue suficiente por sí
mismo para proporcionar la base motivacional del Holocausto.

El verdadero problema de estos marcos no es que no hablen de causas, sino que


no son exhaustivos. Las causas individuales no son sólo causas necesarias y/o
suficientes. Es fácil pensar en ejemplos de causas que no son ni necesarias ni
suficientes. En cada uno de estos ejemplos, la causa actúa en combinación con
otras causas para producir un resultado. Es la combinación más amplia la que
genera el resultado; o dicho de otro modo, los valores de dos o más variables -no
una sola variable- son conjuntamente suficientes (o posiblemente conjuntamente
necesarios) para el resultado. Examinemos estas causas.

Causas INUS y SUIN

Los investigadores orientados a los casos rara vez tratan un único valor de
variable como suficiente para un resultado determinado. En cambio, cuando
intentan identificar las causas que generan un resultado específico, suelen tratar
los valores individuales de las variables como causas INUS. Mackie (1965) deriva
el acrónimo INUS de la siguiente manera: "la llamada causa es, y se sabe que es,
una parte insuficiente pero necesaria de una condición que es en sí misma
innecesaria pero suficiente para el resultado" (p. 246; véase también Mackie,
1980). Una ilustración estilizada de la causalidad INUS es la idea de que un
edificio puede incendiarse (Y1) debido a un cortocircuito (A1) combinado con un
armazón de madera (B1) o debido a un bidón de gasolina (C1) combinado con un
horno (D1); es decir, Y1 = (A1 & B1) v (C1 & D1), donde "&" representa el Y lógico,
la "v" representa el O lógico y "=" representa la suficiencia. No existe una causa
necesaria para el resultado, sino que las combinaciones alternativas son
suficientes.

Las causas INUS son habituales en la investigación orientada a casos concretos.


Por ejemplo, consideremos el argumento de Moore (1966) de que las vías
democráticas en el mundo moderno temprano requerían tanto una burguesía
fuerte como una aristocracia que se alineara con esta burguesía o que estuviera
históricamente debilitada. Según este argumento, hay dos combinaciones que
generan democracia: (a) una burguesía fuerte que se alía con élites aristocráticas,
y (b) una burguesía fuerte y una aristocracia débil. Aunque una burguesía fuerte
es una causa necesaria, la causa de la alianza burguesía-aristocracia y la causa
de la aristocracia débil son causas INUS. Podemos resumir el argumento de la
siguiente manera

Y1 =X1 &(A1 vB1), (1)

donde Y1 = vía democrática; X1 = burguesía fuerte; A1= alianza entre burguesía y


aristocracia; y B1 = aristocracia débil. Ni A1 ni B1 son individualmente necesarios
ni individualmente suficientes. En cambio, son causas INUS que se combinan con
X1 para formar dos combinaciones posibles que son suficientes para Y1. Muchos
otros estudios que utilizan el Análisis Cualitativo Comparativo (ACC), ya sea en su
versión dicotómica o en su versión de conjunto difuso, asumen la causalidad INUS
y tratan de identificar las diferentes vías causales hacia unos resultados
determinados.

Un tipo alternativo de causa combinatoria, vinculada a la necesidad, es la causa


SUIN. Una causa SUIN es, haciendo un paralelismo con la causa INUS de Mackie,
una parte suficiente pero innecesaria de un factor que es insuficiente pero
necesario para un resultado (Mahoney, Kimball y Koivu, 2007). En este caso, los
atributos constitutivos de una causa necesaria se tratan como causas en sí
mismas. Por ejemplo, una teoría muy conocida sostiene que la no democracia (es
decir, una díada no democrática) es necesaria para la guerra. Hay varios atributos
que por sí mismos constituirían no-democracia, incluyendo elecciones
fraudulentas, altos niveles de represión y exclusiones severas del sufragio. En
virtud de constituir la no democracia por sí mismas, cada una de estas condiciones
es una causa SUIN de guerra. Las elecciones fraudulentas, la represión y las
exclusiones del sufragio no son ni necesarias ni suficientes para la guerra, sino
factores que pueden constituir la no democracia, que a su vez es necesaria para la
guerra. O consideremos de nuevo el argumento de Moore (1966). Vimos cómo
una alianza burguesa-aristocrática y una aristocracia débil son causas INUS. Si
ahora imaginamos que Moore tratara estos dos factores como ejemplos cada uno
de un tercer factor -la aristocracia políticamente subordinada- entonces serían
causas SUIN: partes constitutivas suficientes para una causa necesaria (la
aristocracia políticamente subordinada) de la democracia. Podemos resumir esta
idea de la siguiente manera:
Y1 =X1 &Z1;Z1 =A1 vB1, (2)

donde Y1 = vía democrática; X1 = burguesía fuerte; Z1 = aristocracia


políticamente subordinada; A1 = alianza entre burguesía y aristocracia; y B1 =
aristocracia débil. Aquí A1 y B1 son causas SUIN de una vía democrática.

Lógicamente, por tanto, hay cinco tipos de causas que pueden utilizarse en la
investigación orientada a casos. Una causa puede ser (a) necesaria pero no
suficiente, (b) suficiente pero no necesaria, (c) necesaria y suficiente, (d) INUS, o
(e) SUIN. Esta lista parece ser mutuamente excluyente y colectivamente
exhaustiva (Mahoney et al., 2007). De estas cinco causas, la prototípica es una
causa necesaria y suficiente. Todas las demás causas son derivadas de una
causa necesaria y suficiente. De hecho, las otras cuatro causas adquieren mayor
importancia en la medida en que se acercan al umbral de ser una causa necesaria
y suficiente (Mahoney et al., 2007; véase también Braumoeller & Goertz, 2000;
Goertz, 2006; Hart & Honoré, 1959; Ragin, 2006). Así, las causas necesarias son
cada vez más importantes a medida que se acercan a la suficiencia causal. Las
causas suficientes son más importantes a medida que se acercan a la necesidad
causal. Y las causas INUS y SUIN ganan importancia a medida que se acercan a
ser individualmente necesarias y suficientes.

preguntas, los investigadores quieren generalizar sobre los efectos típicos del
factor o factores causales concretos de interés.

Mean Causal Effects

The population-oriented approach in many ways parallels experimental


research.11 Experiments are usually not designed to provide comprehensive
explanations of outcomes. Nor are they designed to explain particular cases.
Rather, they are intended to accurately assess the typical effects of particular
treatments for populations. Experimenters want to know what difference (if any)
one or more treatments has for an outcome on average. The approach is quite
consistent with the idea that causes are probability raisers. One can in fact say that
a treatment is a cause when its presence raises the probability of an outcome
occurring in any given case of a larger population.

The experimental template underpins the definition of causality used in the


population-oriented approach, a point well illustrated by King, Keohane, and
Verba’s (1994, pp. 76-81) famous discussion of “mean causal effect” (β ). They
present this concept using the example of the effect of incumbency on the vote
fraction received by a candidate running for office. The mean causal effect in the
example is the difference between the mean distribution of the vote fraction
received by an incumbent candidate across multiple hypothetical elections and the
mean distribution of the vote fraction received by a nonincumbent across multiple
hypothetical elections. In their notation, β = μIi _ μNi , where μXi is the mean of the
distribution of the dependent variable under condition X and I and N are incumbent
and nonincumbent, respectively. This understanding of β as being equal to the
difference between the means of two distributions is shared by many leading
statistical methodologists (Braumoeller, 2006).12

Population-oriented comparativists often identify causes by estimating β


coefficients in multivariate statistical models. They are especially concerned with
two aspects of β. The first is substantive significance, which derives from the size
of the coefficient and may be evaluated in various ways. The second is statistical
significance, which summarizes the likelihood that the observed finding is a product
of sampling error or other random error and is affected by the number of variables
and cases used in the statistical test. For example, Gerring et al.’s (2005)
argument that democratic stock is an important cause of economic growth is based
on the substantive and statistical significance of β for the democracy stock variable
in their multivariate models. In contemporary comparative politics, it is worth noting,
independent variables of theoretical interest that meet a specified level of statistical
significance (e.g., p ≤ .05) are often considered important causes even if the size of
their effect is modest. Indeed, the total explanatory power of most statistical
models is modest when evaluated using a measure such as adjusted R2. This
underscores the experimental underpinning of this tradition: The goal is to assess
the average effects (if any) of individual variables rather than comprehensively
explain variation on an outcome.

Efectos causales medios

El enfoque poblacional es paralelo en muchos aspectos a la investigación


experimental.11 Los experimentos no suelen estar diseñados para ofrecer
explicaciones exhaustivas de los resultados. Tampoco están diseñados para
explicar casos particulares. Más bien pretenden evaluar con precisión los efectos
típicos de tratamientos concretos para poblaciones. Los experimentadores quieren
saber qué diferencia (si la hay) tienen uno o más tratamientos en un resultado por
término medio. El planteamiento es bastante coherente con la idea de que las
causas aumentan la probabilidad. De hecho, se puede decir que un tratamiento es
una causa cuando su presencia aumenta la probabilidad de que se produzca un
resultado en un caso dado de una población mayor.

El modelo experimental sustenta la definición de causalidad utilizada en el enfoque


orientado a la población, un punto bien ilustrado por la famosa discusión de King,
Keohane y Verba (1994, pp. 76-81) sobre el "efecto causal medio" (β ). Presentan
este concepto utilizando el ejemplo del efecto de la titularidad en la fracción de
votos recibida por un candidato que se presenta a las elecciones El efecto causal
medio en el ejemplo es la diferencia entre la distribución media de la fracción de
votos recibida por un candidato titular en múltiples elecciones hipotéticas y la
distribución media de la fracción de votos recibida por un candidato no titular en
múltiples elecciones hipotéticas. En su notación, β = μIi _ μNi , donde μXi es la
media de la distribución de la variable dependiente bajo la condición X e I y N son
incumbente y no incumbente, respectivamente. Esta interpretación de β como
igual a la diferencia entre las medias de dos distribuciones es compartida por
muchos metodólogos estadísticos destacados (Braumoeller, 2006).

Los comparativistas orientados a la población suelen identificar causas mediante


la estimación de coeficientes β en modelos estadísticos multivariantes. Les
preocupan especialmente dos aspectos de β. El primero es la significación
sustantiva, que se deriva del tamaño del coeficiente y puede evaluarse de varias
formas. El segundo es la significación estadística, que resume la probabilidad de
que el hallazgo observado sea producto de un error de muestreo u otro error
aleatorio y se ve afectado por el número de variables y casos utilizados en la
prueba estadística. Por ejemplo, el argumento de Gerring et al. (2005) de que el
acervo democrático es una causa importante del crecimiento económico se basa
en la significación sustantiva y estadística de β para la variable de acervo
democrático en sus modelos multivariantes. En la política comparada
contemporánea, cabe señalar, las variables independientes de interés teórico que
alcanzan un nivel especificado de significación estadística (por ejemplo, p ≤ .05)
suelen considerarse causas importantes aunque el tamaño de su efecto sea
modesto. De hecho, el poder explicativo total de la mayoría de los modelos
estadísticos es modesto cuando se evalúa utilizando una medida como el R2
ajustado. Esto subraya la base experimental de esta tradición: El objetivo es
evaluar los efectos medios (si los hay) de las variables individuales en lugar de
explicar exhaustivamente la variación de un resultado.

Efectos causales netos

La investigación causal en la tradición orientada a la población se ha ocupado


durante décadas de distinguir la causalidad genuina de la covariación espuria (por
ejemplo, Pearl, 2000, pp. 78-85, 173-200). Cuando se pretende estimar el efecto
medio de X sobre Y en el contexto de un estudio observacional, surge
inmediatamente la cuestión de qué otras variables deben mantenerse constantes.
Tanto el tamaño como la significación estadística de un efecto pueden cambiar
radicalmente dependiendo de las otras variables que se incluyan. Estas otras
variables -conocidas como covariables, concomitantes o factores de confusión-
deben controlarse (condicionarse) si se desea estimar correctamente el efecto
neto de X sobre Y. Los efectos netos se calculan esencialmente dividiendo la
población en subgrupos que sean homogéneos en las variables de control,
midiendo el efecto de los valores de X sobre la distribución de Y en los subgrupos
y, a continuación, promediando los resultados (por ejemplo, Turner, 1997). El
objetivo de esta forma de análisis multivariante no es negar que las variables de
control sean causas de Y, sino descartar la posibilidad de que expliquen el efecto
observado de X sobre Y.

La explicación en la investigación orientada a la población hace varios supuestos


de especificación para mitigar los problemas potenciales que surgen del uso de
datos observacionales en lugar de datos experimentales (por ejemplo, Shadish,
Cook y Campbell, 2002). En un experimento, por supuesto, los casos se asignan
aleatoriamente a diferentes valores de una variable independiente, de forma que,
en teoría, sus características previas no están relacionadas con esos valores. Pero
este tipo de independencia casi nunca es cierta con los datos observacionales.
Por lo tanto, los investigadores orientados a la población necesitan controlar las
variables utilizando herramientas como la estratificación para lograr la
independencia condicional en promedio (independencia condicional media). La
independencia condicional es, en efecto, una forma de tratar de cumplir los
supuestos contrafactuales de causalidad incluidos en este enfoque.

Los investigadores orientados a la población hacen otras suposiciones familiares y


relacionadas, cada una de las cuales puede justificarse en diversos grados,
dependiendo del estudio en cuestión. Entre ellos se incluyen los siguientes:

1. Suposición de valor de tratamiento unitario estable: la idea de que las


influencias entre las observaciones no afectan a los resultados y la noción de que
un valor dado en una variable independiente es estable en todos los casos (para
un excelente debate reciente, véase Brady y Seawright, 2004).

2. Ausencia de endogeneidad: en política comparada, la endogeneidad suele


discutirse junto con los problemas específicos que plantea la causalidad recíproca.
Sin embargo, en sentido estricto, la endogeneidad surge siempre que una variable
independiente está correlacionada con el término de error.

3. Estabilidad temporal: el supuesto de que los efectos causales son estables a lo


largo del tiempo. Las diferencias no reconocidas a lo largo del tiempo pueden
producir un sesgo de variable omitida.

4. Transitoriedad de la medición: el supuesto de que el acto de observar los casos


y medir las variables no altera los efectos causales o, si lo hace, que este impacto
puede modelarse.

La proliferación de técnicas estadísticas cada vez más avanzadas forma parte de


una búsqueda continua para cumplir estos diversos supuestos. El éxito de la
investigación contemporánea en este sentido es objeto de debate. Para nuestro
propósito, este debate no tiene por qué distraernos más que los debates análogos
sobre los méritos de los métodos N pequeños mencionados anteriormente. Más
bien, necesitamos explorar cómo este enfoque del análisis causal, que piensa en
la causalidad en términos de teoría de la probabilidad, puede unificarse con el
enfoque orientado a casos que se ha discutido anteriormente, que piensa en la
causalidad en términos de lógica.

De los casos a la población (y viceversa): Hacia una teoría unificada


El punto de partida de una teoría unificada es el reconocimiento de que, a nivel
poblacional, la causalidad se produce casi exclusivamente a través de causas
INUS. Para ver por qué esto es cierto, tenemos que explorar la relación entre las
causas INUS y las variables que ejercen efectos parciales en los modelos
estadísticos. Como veremos, estas variables tienen los efectos que tienen porque
son causas INUS.

Causalidad a nivel de población

Si se acepta que la causalidad a nivel de población deriva de la causalidad a nivel


de caso, entonces los cinco tipos de causas que pueden aplicarse a los casos
individuales -causas necesarias, suficientes, necesarias y suficientes, INUS y
SUIN- son los únicos tipos de causas que pueden operar a nivel de población. Sin
embargo, cuatro de estos cinco tipos no suelen ser relevantes a la hora de
analizar poblaciones. Más adelante vimos cómo dos tipos -las causas suficientes y
las causas necesarias y suficientes- se utilizan con muy poca frecuencia a nivel de
caso. Si se generaliza al nivel de población, estos tipos serán aún menos
comunes. En cambio, las causas necesarias son habituales en la investigación de
casos. Sin embargo, cuando pasamos al nivel de población, las causas necesarias
son difíciles de encontrar. Por ejemplo, las causas que fueron necesarias para el
alto desempleo en Alemania pueden no haber sido necesarias para el alto
desempleo en Francia; las causas necesarias para casos particulares a menudo
no se generalizan. De hecho, salvo algunas posibles excepciones, como la
hipótesis de que la no democracia (es decir, una díada con un Estado no
democrático) es necesaria para la guerra, los comparativistas no han encontrado
muchas causas necesarias que se apliquen a poblaciones amplias. Dado que las
causas SUIN funcionan a través de causas necesarias, tampoco se descubrirán a
menudo a nivel poblacional.

Esto deja a las causas INUS como el principal tipo de causa que se aplica a nivel
de población. Si las causas INUS están presentes, diferentes conjuntos de valores
de variables conducen a un resultado concreto. La presencia de múltiples
combinaciones de valores de variables que producen el mismo resultado se
denomina a veces "equifinalidad" (George & Bennett, 2005). Aunque la
equifinalidad suele asociarse con las técnicas de ACQ (Ragin, 1987, 2000), su
énfasis en múltiples caminos hacia un resultado dado está implícitamente presente
en la mayoría de las investigaciones orientadas a la población, incluidos los
modelos lineales aditivos que los comparativistas utilizan con frecuencia. En un
modelo lineal aditivo hay innumerables formas de llegar a un resultado (es decir, a
un rango concreto de valores de la variable dependiente). Cada variable
independiente ejerce su propio efecto, y cada variable independiente puede
compensar potencialmente cualquier otra. Un caso puede tener el resultado de
interés porque tiene valores altos en determinadas variables, mientras que un
caso diferente llega al mismo resultado porque tiene valores altos en otras
variables. Ningún valor de variable es necesario, pero diferentes valores de
variable (junto con el término de error) son suficientes para producir el resultado.
La equifinalidad es, por tanto, omnipresente en la corriente principal de la
investigación orientada a la población (Mahoney y Goertz, 2006).

La equifinalidad no es la única cuestión a la que deben prestar atención los


analistas de las causas INUS. Otro supuesto clave en el que se basa la causalidad
INUS es que las variables no suelen ejercer efectos independientemente unas de
otras. Por el contrario, el efecto de una variable depende de los valores de otra u
otras variables. Las variables funcionan juntas como paquetes, no como factores
aislados. El álgebra booleana es la forma habitual en que los investigadores
orientados a casos concretos intentan modelizar formalmente este tipo de
causalidad (Ragin, 1987, 2000). Algunos metodólogos estadísticos han
desarrollado herramientas ampliamente paralelas, como el probit booleano y el
logit booleano (Braumoeller, 2003). Además, el estudio de los efectos de
interacción, que no es infrecuente (por ejemplo, quizá el 25% de los artículos
comparativos cuantitativos incluyen ahora al menos un término de interacción), ha
movido la investigación estadística en la dirección de la causalidad combinatoria
(Kam & Franzese, 2007). En la medida en que los comparativistas estadísticos
empiecen a utilizar modelos de interacción saturados en los que se evalúen y
simplifiquen todas las interacciones posibles de forma descendente, asistiríamos
esencialmente a una integración de las técnicas de ACQ y los métodos
estadísticos. El punto clave aquí es que existen varios métodos que, en principio,
pueden utilizarse para estudiar las causas INUS y la causalidad combinatoria en
poblaciones amplias.

De hecho, algunos destacados académicos sugieren que muchos o la mayoría de


los resultados a nivel poblacional deben explicarse en términos de causalidad
combinatoria (por ejemplo, Achen, 2005; Franzese, 2003; Hall, 2003; Ragin,
1987). Si están en lo cierto, cabe preguntarse si pensar en la causalidad en
términos de los efectos medios de las variables individuales -el enfoque tradicional
de la investigación orientada a la población- es útil en absoluto. Las dudas se ven
reforzadas por escritos recientes sobre efectos de interacción en la tradición
orientada a la población. Los metodólogos han dejado claro que se deben incluir
términos constitutivos de orden inferior al probar modelos de interacción
multiplicativa, pero no se puede interpretar el coeficiente de estos términos como
un efecto medio (Brambor, Clark y Golder, 2005; Braumoeller, 2004; Kam y
Franzese, 2007). A medida que aumenta el número de términos de interacción, la
idea de pensar en los coeficientes como si informaran de los efectos de variables
individuales empieza a desaparecer por completo. Si se utilizara un modelo de
interacción saturado, de hecho, no se podría decir prácticamente nada sobre las
variables individuales. Análogamente, con los modelos QCA, la atención se centra
en las combinaciones causales, no en los factores individuales (con la excepción
de las causas que son individualmente necesarias o suficientes). ¿Qué
importancia tiene, entonces, la noción de un efecto causal medio para una variable
individual -que sigue siendo la forma dominante de conceptualizar la causalidad en
la ciencia política- a la hora de pensar en la causalidad?

Efectos causales medios como síntomas de causas INUS

La respuesta a esta pregunta es que las variables independientes que ejercen


efectos par- ciales en modelos estadísticos bien especificados son causas INUS;
normalmente son, de hecho, causas INUS importantes. Sin embargo, salvo
algunas excepciones parciales (Brady & Seawright, 2004; Marini & Singer, 1988;
Shadish et al., 2002), la posibilidad de que los efectos causales medios sean
síntomas de causas INUS no se ha desarrollado en la literatura metodológica.

La relación entre un efecto causal medio y una causa INUS puede entenderse
mejor si definimos primero una causa INUS "importante". El criterio general es que
una causa INUS es más importante a medida que se acerca a ser una causa
necesaria y/o suficiente; además, debe ser una causa no trivial.14 Tomando
prestado el lenguaje de la teoría de la probabilidad, podemos decir que las causas
INUS importantes son causas "probabilísticamente necesarias" y/o
"probabilísticamente suficientes" a nivel poblacional. El grado en que son
probabilísticamente necesarias o probabilísticamente suficientes puede evaluarse
en la práctica con una o varias técnicas disponibles (véase Braumoeller y Goertz,
2000; Clark, Gilligan y Golder, 2006; Dion, 1998; Eliason y Stryker, en prensa;
Ragin, 2000).

Las causas INUS probabilísticamente necesarias son factores que normalmente o


casi siempre tienen que estar presentes para que se produzca el resultado. Por lo
tanto, suelen estar presentes en las distintas combinaciones de valores de
variables que pueden generar el resultado de interés. Podría decirse que el
tabaquismo como causa del cáncer de pulmón es un buen ejemplo. Fumar es una
causa INUS porque debe combinarse con otros factores ambientales y biológicos
para generar el cáncer. Al mismo tiempo, el tabaquismo puede ser
probabilísticamente necesario para el cáncer de pulmón, es decir, suele estar
presente en las distintas combinaciones de valores variables que generan el
cáncer de pulmón.15 El tabaquismo, por supuesto, ejerce un efecto parcial sobre
el cáncer de pulmón en la investigación orientada a la población (es decir,
aumenta la probabilidad del resultado). La razón por la que el tabaquismo ejerce
este efecto parcial y, por lo tanto, puede tratarse como un aumento de la
probabilidad es precisamente porque es una causa INUS importante. Las
propiedades causales de la variable (es decir, su condición de causa INUS
probabilísticamente necesaria) la llevan a manifestar el efecto estadístico a nivel
de población.

Las causas INUS probabilísticamente necesarias también se discuten a menudo


de forma implícita en la literatura de política comparada. Un ejemplo es la
presencia de una crisis económica como causa de las transiciones de tercera ola a
la democracia. Como señaló Bermeo (1990) en su reseña de Transitions from
Authoritarian Rule, de O'Donnell, Schmitter y Whitehead (1986): "Seguramente no
es casualidad que las crisis económicas acompañaran a todas las
transformaciones aquí analizadas. El patrón sugiere que las crisis económicas
podrían ser un incentivo necesario, aunque no suficiente, para el
desmoronamiento de los regímenes autoritarios" (p. 366). Aunque ahora se
pueden encontrar fácilmente casos de transición democrática reciente sin crisis
económica (por ejemplo, Chile), parece justo concluir que la crisis fue una causa
probabilísticamente necesaria de una transición democrática de tercera ola (es
decir, los países rara vez experimentaron transiciones durante épocas de bonanza
económica; para pruebas sistemáticas, véase Haggard & Kaufman, 1995, pp. 32-
36). Los modelos estadísticos que muestran un efecto individual de la crisis
económica sobre la transición democrática a nivel de población (por ejemplo,
Gasiorowski, 1995) recogen el estatus de esta variable como causa INUS
probabilísticamente necesaria.

El otro tipo de causas INUS importantes son las que son probabilísticamente
suficientes. Estas causas no tienen que combinarse con muchas otras causas (no
triviales) para generar el resultado de interés. Más bien, las causas
probabilísticamente suficientes casi pueden producir el resultado por sí mismas
(pero necesitan algo de ayuda de otras variables). Por ejemplo, el cáncer de
pulmón es probabilísticamente suficiente para la muerte. La mayoría de las
muertes no implican cáncer de pulmón, pero cuando el cáncer de pulmón está
presente, generará la muerte en la mayoría de las circunstancias (aunque hay
algunas excepciones). De nuevo, las causas INUS que son probabilísticamente
suficientes se manifestarán como variables que ejercen efectos parciales cuando
se incluyen en modelos estadísticos correctamente especificados.

Las causas INUS probabilísticamente suficientes también se encuentran


fácilmente en la literatura comparativa. Por ejemplo, uno de los hallazgos
empíricos más célebres en este campo se refiere a la relación entre desarrollo
económico y democracia. Aunque el funcionamiento específico de esta relación es
objeto de debate, muchas pruebas sugieren que un alto nivel de desarrollo
económico es probabilísticamente suficiente para la democracia o la estabilidad
democrática (por ejemplo, Boix & Stokes, 2003; Przeworski, Alvarez, Cheibub, &
Limongi, 2000). Así pues, los países ricos son casi siempre democráticos. Hay
algunas excepciones y, desde luego, no se puede afirmar que la riqueza por sí
sola sea suficiente para la democracia (o la estabilidad democrática). Sin
embargo, cuando hay una riqueza significativa, se puede estar casi seguro de que
también habrá democracia (o estabilidad democrática). Los resultados estadísticos
que muestran que el desarrollo económico tiene un efecto significativo sobre la
democracia (por ejemplo, Londregan y Poole, 1996) son probablemente un
artefacto del estatus probabilístico suficiente de esta variable. De nuevo, la
implicación es que la variable aparece como un aumento de la probabilidad porque
es una causa INUS importante.
Podemos concluir, entonces, que las variables individuales que revelan efectos
parciales en modelos estadísticos correctamente especificados son causas. Pero
los efectos que muestran resumidos en un coeficiente estadístico no son lo que las
convierte en causas. Son causas por el hecho de ser causas INUS importantes (es
decir, son probabilísticamente necesarias y/o suficientes para los resultados). Y
los efectos que muestran no son más que síntomas de esa condición lógica
subyacente.

Traducción de ida y vuelta

Tratar las variables que muestran efectos causales medios en los modelos
estadísticos como causas INUS es útil de varias maneras. En primer lugar, resulta
muy esclarecedor saber si una variable ejerce su efecto porque es
probabilísticamente necesaria o porque es probabilísticamente suficiente (o ambas
cosas). Por ejemplo, la conclusión de que un mayor nivel de desarrollo económico
es casi siempre suficiente para la democracia tiene una importancia sustantiva
evidente. Nos dice que la promoción del crecimiento económico por encima de un
cierto nivel casi garantiza la promoción de la libertad humana. Lo mismo puede
decirse de la conclusión de que unos niveles elevados de gobernanza de izquierda
acumulativa son casi siempre necesarios para unos niveles elevados de
guarderías públicas (Stryker, Eliason y Tranby, en prensa). La implicación es que
los programas públicos de guarderías sólo se desbancarán con un cambio a largo
plazo hacia la derecha en el gobierno. Aunque este tipo de conclusiones no tienen
que ver con los efectos parciales, como tradicionalmente se ha entendido, son
claramente útiles si son correctas.

Además, al traducir un hallazgo estadístico inicial al lenguaje de la causalidad


INUS, el investigador puede teorizar mejor cómo debe incluirse el factor en un
modelo posterior que evalúe la causalidad combinatoria. En el caso de las causas
INUS que son probabilísticamente necesarias, deben incluirse en casi todas las
combinaciones causales de un modelo QCA (y normalmente tendrían que
aparecer también en muchos términos de un modelo de interacción multiplicativa).
Por ejemplo, dado que la no democracia (es decir, una díada no democrática) es
al menos probabilísticamente necesaria para la guerra, este factor debe incluirse
como una causa en casi todas las combinaciones causales de un modelo QCA de
guerra interestatal. Las causas INUS que son probabilísticamente suficientes, por
el contrario, a menudo no necesitan incluirse en las combinaciones causales. Esto
es así porque estas causas pueden generar el resultado de interés casi por sí
mismas, necesitando sólo un poco de ayuda de otros factores (no triviales). Por
ejemplo, si la presencia de un gran grupo minoritario históricamente explotado es
casi suficiente para los niveles inicialmente bajos de rendimiento social en
Hispanoamérica (Mahoney, 2003), entonces esta causa puede analizarse
razonablemente bien por sí misma sin incluirla como parte de un paquete causal
más amplio.

Así pues, el enfoque orientado a la población puede ayudar a los investigadores a


localizar las causas importantes del INUS. Y las causas INUS pueden evaluarse
posteriormente con modelos QCA o de interacción más complejos. Nunca se
insistirá lo suficiente en la importancia de encontrar las variables y combinaciones
adecuadas para incluirlas en estos modelos. Nuestras teorías de política
comparada plantean habitualmente interacciones complejas (Hall, 2003), pero casi
nunca son lo bastante precisas como para localizar todas las causas INUS
relevantes, con implicaciones potencialmente devastadoras para la comprobación
de las teorías causales en la práctica (por ejemplo, Kam y Franzese, 2007). Las
herramientas para especificar mejor nuestros modelos causales combinatorios son
de enorme valor.

Más allá de esto, por supuesto, los investigadores siempre estarán interesados en
tratar de estimar los efectos medios de las variables individuales por derecho
propio. La información sobre los efectos medios ayuda a hacer predicciones
informadas y a estimar el impacto futuro de una intervención determinada. Los
individuos y los actores políticos buscan este tipo de información cuando
maniobran en el mundo. Por ejemplo, una cosa es saber que el autoritarismo es
una causa INUS probabilísticamente necesaria de revolución social (o que fumar
es una causa INUS probabilísticamente necesaria de cáncer de pulmón). This tells
us that governments can ward off social revolutions by promoting formal
democratic institutions (or that we can be fairly certain to avoid lung cancer by not
being exposed to tobacco smoke). Yet it is another thing to have a good estimate
of the risk of social revolution a government faces by having authoritarian
institutions (or the risk of lung cancer we face by smoking). The true probability of
the outcome occurring at the case level is 1 or 0. However, in the absence of full
knowledge about all of the sufficiency combinations that can produce the outcome,
we would like to know if the probability is more likely 1 or 0, and exactly how much
more likely! We seek insight about what we can most reasonably expect to happen
in a context of limited knowledge. The population-oriented tradition can help
decision makers formulate better guesses about whether, given a particular course
of action and other known conditions in the world, the probability of a specific
outcome of interest occurring is really 1 or 0.

These observations bring us full circle. Just as one might want to trans- late
findings from population-oriented research into the causal language of the case-
oriented tradition, so too might one wish to translate findings about probabilistically
necessary and probabilistically sufficient INUS causes into the language of mean
causal effects.

Conclusión

Este artículo ha explorado la unificación de los enfoques de la causalidad


orientados al caso y a la población en la política comparada. El método de
unificación propuesto aquí implicaba extender el enfoque orientado a casos al
nivel de población, bajo el supuesto de que los patrones causales a nivel de
población deben ser derivados de la causalidad que está ocurriendo a nivel de
casos. Con esta ampliación, quedó claro que las causas INUS son realmente las
que se estudian indirectamente en la mayoría de las investigaciones orientadas a
la población. En particular, las causas INUS importantes (es decir, las causas
INUS probabilísticamente necesarias y/o suficientes) se manifiestan como
variables que muestran efectos causales parciales en modelos estadísticos bien
especificados.

Una implicación básica de este análisis es que más investigadores comparativos


deben intentar estudiar las causas INUS lo más directamente posible a nivel de
población, utilizando modelos estadísticos con diversos términos de interacción o
las herramientas del QCA. Sin duda, estos investigadores se enfrentarán a
enormes retos metodológicos en su esfuerzo por generar resultados
interpretables, dadas las enormes necesidades de datos de estos modelos. Pero
este tipo de análisis sensible a la complejidad puede ser el único camino, a largo
plazo, hacia una generalización causal válida en muchos casos de política
comparada. Mientras tanto, los que trabajan en esta agenda se beneficiarán sin
duda de los conocimientos de la investigación en curso sobre los efectos medios
de las variables individuales y las causas específicas en casos particulares.

También podría gustarte