Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por qu no evaluamos las polticas pblicas como los frmacos? Una apuesta por la experimentacin social - David Casado
David Casado es doctor en Economa por la Universitat Pompeu Fabra. Como analista
de Ivlua, al que se incopora en 2009, ha participado en la elaboracin de varias de las
guas metodolgicas, ha sido formador en las diversas ediciones del Ciclo de Formacin en Evaluacin de Polticas Pblicas y ha participado en varias de las evaluaciones
realizadas por dicha institucin.
Introduccin
La crisis econmica ha suscitado un renovado inters por la evaluacin de polticas pblicas o, al menos, por los conceptos sobre los que sta versa. As,
ya sea en el mbito estatal, autonmico o local, los
responsables polticos, sean del color que sean, insisten en la necesidad de mejorar la efectividad de
determinados programas o ganar en eficiencia en
la provisin de los servicios pblicos. Esta insistencia nos parece positiva, aunque tenemos dudas de
que este nfasis se mantenga cuando vengan tiempos mejores, lo cual sera un error: preguntarse
si una determinada poltica activa aumenta la insercin laboral de los parados (efectividad) o si, comparado con otras intervenciones, el coste por parado
insertado de dicha poltica es ms o menos favorable (eficiencia) son cuestiones que la Administracin
debera plantearse en todo momento, sea cul sea
la situacin econmica y el estado de las finanzas
pblicas.
No obstante, pese a este auge de la evaluacin en el
2
que el programa no es efectivo? Bueno, de-
En las pginas que siguen trataremos de explicar en qu consiste un ES y por qu, pese
a su sencillez, constituye el mtodo ms ro-
diendo impactos?
3
ao. Cmo responderan los mdicos a la
ta o no efectivo? En principio, puesto que hace varias dcadas que la profesin mdica
4
experimental del programa Segunda Oportu-
nidad.
nicas?
Existen diseos evaluativos no experimentaGracias a la aleatorizacin, un experimento
logra que el grupo de tratamiento y el de
control se encuentren equilibrados en todos
aquellos atributos personales que pueden
influir sobre el outcome de inters, como puedan ser, en el caso de Segunda Oportuni-
les que tambin utilizan grupos de comparacin, como puedan ser el matching o el modelo de dobles diferencias, lo cual les permite tener en cuenta la influencia de dichos factores contextuales. Sin embargo, en la medida en que el proceso de participacin en el
programa no es aleatorio, la condicin de que
ambos grupos tengan caractersticas
5
muy similares no est garantizada.
pado.
rado.
6
Qu se entiende exactamente por aleatori-
zacin?
mentado.
7
ES no slo se disean a la par que la poltica
dispuestos a impulsarlos.
para los parados de larga duracin, los resultados fueron exactamente los contrarios
eron
negativos
resultados
nulos
8
o suplementar la informacin de stos a tra-
modo vlido.
9
repercusin meditica result ser especial-
experimentales.
10
realizados en Dinamarca (Graversen & Van
Tratndose del diseo ms robusto para evaluar el impacto de una poltica, y pese haber
11
nueva poltica utilizando un mecanismo tan
12
sino tambin la mayor o menor influencia
de la formacin, etc.).
efecto, deviene crucial la labor de inventariado llevada a cabo por organizaciones o inicia-
Algunas precauciones
Puede que las crticas a los experimentos no
resulten adecuadas en muchos casos, pero
no por ello hay que pensar que llevar a cabo
una evaluacin experimental resulta una tarea sencilla. En primer lugar, desde una
perspectiva metodolgica, hay que ser consciente de los retos que supone realizar una
evaluacin experimental y de las dificultades
que pueden aparecer. Algunas de las ms
importantes son las siguientes [5]:
13
de tratamiento. Dejando de lado los detalles
estadsticos, diremos simplemente que hay
dos factores que influyen especialmente sobre la cuestin del tamao de las muestras:
de un lado, la magnitud del impacto que queramos ser capaces de detectar (por ejemplo,
aumentos de la insercin laboral de un punto
porcentual) y, de otro, el grado de incertidumbre sobre la validez de nuestros resultados que estemos dispuestos a tolerar. A veces, existen determinadas intervenciones en
las que basta con aleatorizar unas decenas
conseguir lo mismo.
De todos modos, es
tarlos.
es
14
En cualquier caso, la naturaleza prospectiva
de los ES hace que las fases de planificacin
y diseo de la evaluacin sean de crucial importancia. El riesgo de contaminacin, la
existencia de externalidades o cualquier otro
factor que puedan sesgar los resultados de la
evaluacin, debern ser anticipados e incorporados al diseo del experimento para tratar de eliminarlos o, al menos, minimizar su
alcance. En caso contrario, cuando el experi-
otros
condicionantes
poltico-
por ms tiempo.
15
Estando como estamos inmersos en una crisis de las finanzas pblicas muy preocupante, parece obligado impulsar el desarrollo de
ES: permitiran cuantificar la efectividad real
de buena parte de las polticas pblicas que
estn ahora bajo sospecha, y que se eliminan
o mantienen sin evidencia alguna sobre su
efectividad, y tambin de los nuevos programas que a menudo se proponen para mejorar la situacin. Asimismo, existen mltiples
profesionales con capacidad tcnica suficiente como para llevar a cabo este tipo de evaluaciones, especialmente en el mbito universitario. Por ltimo, como pone de manifiesto el artculo de Blanca Lzaro en esta
misma revista, existen frmulas de institucionalizacin de la evaluacin experimental
que podran aplicarse en nuestro contexto sin
demasiados problemas (por ejemplo, el Fons
dExprimentation pour la Jeunesse mencionado anteriormente).
Una parte del camino ya est hecho. En el
fondo, la mayora de ES no son sino programas piloto cuya generalizacin depende, fundamentalmente, de la capacidad que demuestren de resultar eficaces. Y, los pilotos,
con ese mismo nombre, no son ajenos a la
realizada de nuestras polticas pblicas: as,
por poner solo un ejemplo, el programa Su-
16
que la experimentacin social es el modo
ms fiable, si se lleva a cabo correctamente,
de evaluar si algo funciona o no. Somos
conscientes de que se trata de un cambio
cultural de primera magnitud.
El camino se nos antoja largo y plagado de
dificultades, pero no hay que pensar que este
no pueda ser recorrido, a menos que aceptemos que hay algo intrnseco a nosotros, algo
gentico, que nos impide introducir la evaluacin experimental en nuestras polticas
pblicas. Nosotros creemos que no lo hay.
De hecho, con este artculo, hemos querido
aportar nuestro granito de arena para que
ms pronto que tarde se llegue a invalidar,
tambin en este campo, el viejo tpico de que
Spain is different y que, por fin, la experimentacin social acabe cruzando los Pirineos.
17
Para saber ms
Descrgate gratuitamente el informe Test, Learn and Adapt, recientemente publicado
por el Cabinet Office del Reino Unido: http://is.gd/U29XIl
No te pierdas el excelente curso gratuito sobre evaluacin experimental impartido por
Esther Duflo y otros miembros del Poverty Action Lab (MIT): http://is.gd/yBeJLN
Muy recomendable la web del What Works Clearinghouse: un magnfico repositorio
sobre intervenciones en el mbito educativo evaluadas experimentalmente: http://is.gd/
j3v2R4
[1]El Plan Prepara, para aquellos que han estado de vacaciones fuera de Espaa, es el programa que concede 400 euros a
los parados de larga duracin que han agotado la prestacin o el subsidio de desempleo, siempre y cuando estos acepten
participar en acciones formativas y/o de orientacin laboral.
[2] No siempre los tratamientos sanitarios son sometidos al escrutinio de evaluaciones experimentales. A este respecto, un
caso especialmente dramtico es el tratamiento con esteroides aplicado a quienes haban sufrido un traumatismo craneal (Haynes et al., 2012). Esta prctica, que se haba utilizado de forma rutinaria durante dcadas, fue sometida a un ensayo
clnico en 2004. Los resultados no slo no demostraron lo que todo el mundo crea (esto es, que se trataba de un tratamiento efectivo), sino que indicaron que el grupo de tratamiento estaba experimentando un riesgo de muerte mayor. De hecho,
el ensayo tuvo que suspenderse para no seguir daando a los sujetos tratados.
[3] En trminos tcnicos este equilibrio implica que, para cada una de dichas caractersticas, no existen diferencias estadsticamente significativas entre la media observada en uno y otro grupo. Vase Duflo et al. (2007) para una descripcin formal
de los fundamentos estadsticos de los experimentos sociales como tcnica para medir impactos.
[4] Pueden encontrarse ejemplos de polticas inefectivas, o incluso perjudiciales, en muchos mbitos de intervencin pblica. Haynes et al. (2012) ofrecen ejemplos interesantes al respecto.
[6] A este respecto, resulta ilustrativo uno de los primeros experimentos llevado a cabo en Noruega en materia de polticas
laborales (Torp et al, 1993). Gracias a la existencia previa de un exceso de demanda generalizado, con ms parados que
plazas disponibles, se pens que la aleatorizacin sera factible. Sin embargo, tras la puesta en marcha del experimento,
los trabajadores de las oficinas de trabajo, que deban llevar a cabo el proceso de seleccin, optaron por identificar como
potenciales candidatos un nmero tal de personas que siempre coincida con el de plazas disponibles, eliminando por tanto
la necesidad de aleatorizar la participacin.
18
Bibliografa
1130.
mised Controlled Trials. Cabinet Office. Behavioural Insights Team. Retrieved from http://
is.gd/U29XIl
19
Newhouse, J. P. (1993). Free for all?: lessons
labour market measures: Evaluating the effects of active labour market policies. Copenhagen, Ministry of Labour. Copenhagen: Ministry of Labour.
Vias, V. (2009). The European Unions Drive
towards Public Policy Evaluation The Case of
Spain. Evaluation, 15(4), 459472.