Está en la página 1de 35

Suscríbete a DeepL Pro para poder traducir archivos de mayor tamaño.

Más información disponible en www.DeepL.com/pro.

?. F'>1 "III I I-Ii'J£i


( .all..!S,-\I F F I- F I "I ?
\\"IT I I R-\'*I FJCi'v1lZE I?
L1PE f-II 'v1EN1-'L-

Uno de los principales objetivos del análisis de datos en las clases de tamaño normal, de 22 a
ciencias sociales es la estimación de los efectos causales, 25 alumnos, hasta el final del tercer
también conocida como inferencia causal. ¿Qué son los efectos curso. Los investigadores siguieron
causales? ¿Y cuál es la mejor forma de estimarlos? Éstas son el progreso de los alumnos a lo
las principales preguntas a las que responderemos en este largo del tiempo. Como variables de
capítulo. Para ilustrar los conceptos tratados, analizamos los resultado de interés, tenemos las
datos de un experimento del mundo real. En concreto, puntuaciones de los alumnos en los
estimamos el efecto causal de las clases pequeñas en el exámenes estandarizados de
rendimiento de los alumnos utilizando datos del Proyecto STAR. lectura y matemáticas de tercer
grado, así como las tasas de
graduación en la escuela
secundaria.

En la década de 1980, los legisladores de Tennessee


empezaron a considerar la posibilidad de reducir el tamaño de
las clases en las escuelas del estado en un esfuerzo por
mejorar el rendimiento de los alumnos. Algunos estudios
habían sugerido que las clases más pequeñas favorecen más
el aprendizaje que las clases de tamaño normal,
especialmente en los primeros años de escolarización. Sin
embargo, reducir el tamaño de las clases exigiría fondos
adicionales para pagar a los profesores y el espacio de las
aulas. Antes de seguir adelante con la nueva política, la
legislatura decidió encargar una investigación exhaustiva sobre
los efectos causales de las clases pequeñas en el rendimiento de
los alumnos. El resultado fue un estudio con un presupuesto
de millones de dólares denominado Proyecto Relación
Alumnos-Profesor (Proyecto STAR).

En este capítulo analizamos una parte de los datos del


Proyecto STAR. El objetivo del proyecto era examinar los
efectos del tamaño de la clase en el rendimiento de los alumnos
a corto y largo plazo. El proyecto consistía en un experimento
en el que los alumnos de preescolar eran asignados
aleatoriamente a clases pequeñas, de 13 a 17 alumnos, o a
Símbolos, operadores y funciones de R introducidos en este capítulo:
-y

Basado en Frederick Mosteller, "The Ten- nessee Study of Class Stze tn


the Earlq School Grades", Future of Children 5, nº 2 (1995): 113-27.
Estudiamos los efectos de las clases pequeñas en comparación con las
clases regulares (sin ayudantes), a partir de datos de alumnos asignados a
clases regulares con ayudantes. Nos centramos en el grupo total de
participantes que fueron asignados aleatoriamente a diferentes tipos de
clases antes de entrar en el jardín de infancia y excluimos las
observaciones con datos incompletos en las variables utilizadas en los
análisis.
28 CAPÍTULO 2

Los legisladores de Tennessee querían que los investigadores


calcularan los efectos causales de las clases pequeñas en los
resultados educativos. En concreto, querían saber si el
rendimiento de los alumnos mejora como consecuencia directa
de asistir a clases reducidas y no sólo como resultado de otros
factores que pueden acompañar a las clases reducidas, como
mejores profesores, compañeros de clase con mayor
rendimiento o mayores recursos.

se refieren a la conexión causa-efecto


entre dos variables. En este caso, las dos variables son (i) clase
pequeña y (ii) rendimiento de los alumnos.

E n este libro estudiamos las relaciones causales en las que


e x i s t e u n a clara direccionalidad en la relación entre las dos
CONSEJO: En algún momento habrá variables: los cambios en una variable pueden provocar cambios
aprendido qué son las variables en la otra. Utilizamos esta direccionalidad para distinguir entre
dependientes e independientes. Las las variables. Nos referimos a la variable en la que se origina el
variables de tratamiento son un tipo de cambio como ' '
variable independiente, y las variables de '- Nos referimos a la variable que puede cambiar en respuesta
resultado son lo mismo que las variables
dependientes. al cambio en la variable de tratamiento como la - .- - ! . En este
caso, la clase pequeña es la variable de tratamiento, y el
rendimiento de los alumnos es la variable de resultado.

En notación matemática, representamos la variable de


tratamiento como A y la variable de resultado como V.
Representamos la relación causal entre ellas visualmente con
una flecha de A a V. La dirección de la flecha indica que los
cambios en A pueden producir cambios en Y, pero no al r e v é s :

En el Proyecto STAR, nos interesa la siguiente relación causal:

clase pequeña -+ rendimiento de los alumnos

La distinción entre variables de tratamiento y de resultado


depende de la naturaleza de la relación causal entre ellas, así
como de la pregunta de investigación. La misma variable puede
ser el resultado en un estudio pero ser el tratamiento en otro. Por
ejemplo, en un estudio podemos estar interesados en el efecto de
asistir a una clase pequeña sobre la probabilidad de graduarse
en el instituto. En este caso, la variable que indica si un
estudiante se graduó en el instituto, graduado, es la variable de
resultado (diagrama A a continuación). En otro estudio,
podríamos estar interesados en el efecto de graduarse en el
instituto sobre los salarios futuros. En ese caso, graduado sería
la variable de tratamiento (diagrama B ).

(A) clase pequeña -+ graduados


(B) salario futuro graduado
EXPERIMENTOS 29
ALEATORIOS

En este libro, en aras de la simplicidad, nos centramos en las RECUERDE: Una variable btnarq toma
variables de tratamiento que son binarias, es decir, que indican si sólo dos valores, en este libro 1 s y 0s, y
el tratamiento e s t á presente o ausente. Definimos la variable de la notación i identifica el posttton de la
observación tn un dataframe o tn una
tratamiento para cada individuo i como: variable.

1 si el individuo i recibe el tratamiento


0 si el individuo i no recibe el tratamiento

En función de si el individuo recibe el tratamiento, hablamos de


dos condiciones diferentes:
es la condición con el tratamiento (A/=1)
- ' i x la condición sin el tratamiento ( i'0).

Describimos las observaciones que reciben el tratamiento como


bajo tratamiento o tratadas y las que no lo reciben como bajo
control o no tratadas.

Por ejemplo, en el análisis del conjunto de datos STAR, nos


interesa examinar los efectos de asistir a una clase pequeña sobre RECUERDE: En el conjunto de datos
el rendimiento de los alumnos. La variable de tratamiento, que STAR, cada observación i representa a un
alumno diferente, ya que la unidad de
denominamos pequeña, es una variable binaria igual a 1 si el observación son los alumnos.
alumno asistió a una clase pequeña y a 0 en caso contrario.
Formalmente, definimos smrt// como:

1 si el estudiante i asistió a un cfass pequeño


peque
0 si el estudiante i no asistió a un pequeño cfass
ño

Veremos diferentes tipos de variables de resultados. Por ejemplo,


en el conjunto de datos STAR, analizaremos el efecto de asistir a
una clase pequeña en tres medidas diferentes del rendimiento de
los alumnos: lectura, matemáticas y graduado. Mientras que las
dos primeras variables de resultado son no binarias, la tercera es
binaria. Como veremos más adelante en el capítulo, la
interpretación de los resultados depende del tipo de variable de
resultado utilizada en el análisis.

!s\"l1yI1 t "5tiII1.s, IIJ jrly : .- - ! - ' .: ' . i. , intentamos tO


cuantificar el cambio en la variable de resultado Y provocado por
un cambio en la variable de tratamiento X. Por ejemplo, si
estamos interesados en el efecto de las clases pequeñas sobre
la lectura, queremos medir en q u é m e d i d a el rendimiento de
los alumnos en el examen de lectura mejora o empeora como
resultado de asistir a una clase pequeña, en comparación con
una clase de tamaño normal.
30 CAPÍTULO 2

Tenga en cuenta que al estimar un efecto causal, estamos


intentando medir un cambio en V, concretamente el cambio en V
causado por un cambio en X. En notación matemática,
representamos el cambio con A (la letra griega Delta) y, por lo
tanto, representamos un cambio en el resultado como A V.

Para medir este cambio en el resultado Y, l o ideal sería comparar dos


resultados potenciales: el resultado cuando el tratamiento está
presente y el resultado cuando el tratamiento está ausente. En
notación matemática, representamos estos dos resultados
potenciales de la siguiente manera:
- ' rrj'resents the - - i- ' - --- - . i iI - - '
para el individuo i (el valor de V/ si A/ 1)
- - - - - - - - - - - - - - - - - - - - - - - - - - : - -- '
' - *o i idividuaf i (el valor de Yi si i '0).

Si, para cada individuo i, pudiéramos observar ambos resultados


potenciales, entonces calcular el cambio en el resultado V causado por
el tratamiento A sería sencillo. Simplemente calcularíamos la
diferencia entre estos dos resultados potenciales. Matemáticamente,
los efectos causales individuales de recibir el tratamiento X sobre el
resultado Y se calcularían como se muestra en la fórmula 2.1.

FÓRMULA 2.1. Definición de los efectos


causales t n d i v t d - u a l e s de un
tratamiento sobre un resultado.

Por ejemplo, si estamos estfmatLnq el efecto de asistir a una clase


pequeña en las puntuaciones de las pruebas de lectura utilizando
los datos del Proyecto STAR, la variable de tratamiento X sería
pequeña y la variable de resultado V sería la lectura. En este caso,
para cada alumno i, nos gustaría observar las puntuaciones en las
pruebas de lectura de tercer grado tanto (i) después de asistir a
una clase pequeña desde preescolar hasta tercer grado como (ii)
después de asistir a una clase de tamaño normal desde preescolar
hasta tercer grado. Si esto fuera posible, podríamos medir
directamente el efecto causal que la asistencia a una clase
pequeña tiene sobre el rendimiento en lectura de cada alumno
calculando bg:
EXPERIMENTOS 31
ALEATORIOS

CONSEJO: Se trata de la fórmula 2.1 con la


lectura como variable Y y la clase pequeña
pisando, -- leyendo,(pequeño/--1) - rertdin§,(pequeño;--0) donde: como variable A. Si pudiéramos observar
- y lectura, es el cambio en los resultados de las pruebas de ambos resultados potenciales para cada
lectura que habría experimentado el estudiante si hubiera alumno, podríamos utilizar esta fórmula para
calcular los efectos causales individuales de
asistido a una clase reducida, en comparación con una clase de
asistir a una clase pequeña sobre las
tamaño normal. puntuaciones en los exámenes de lectura.
- lectura;(smo///-1 ) es l a puntuación obtenida en la prueba de
lectura de tercer grado por el alumno i después de asistir a una
clase pequeña (el valor de lectura, Si pequeña;--1)
- lectura;(pequeño;=0) es la puntuación en la prueba de lectura de
tercer grado del mismo alumno i después de asistir a una clase
de tamaño normal (el valor ol lectura, ''I smrt//;--0).

Imaginemos, por un momento, que pudiéramos observar ambos


resultados potenciales para cada uno de los seis primeros alumnos
del conjunto de datos STAR. Véanse las dos primeras columnas de
la tabla 2.1 a continuación. A título ilustrativo, hemos inventado los
valores de los resultados potenciales no observados (en gris). Si
estos fueran los verdaderos resultados potenciales, entonces los
efectos causales individuales de los pequeños en la lectura para
estos seis alumnos serían los valores mostrados en la tercera
columna de la tabla 2.1.

i lectura(pequeño--1) lectura(pequeño--0) pisando


TABLA 2.1. Si para cada alumno i
1 578 571 7
pudiéramos observar ambos resultados
2 611 612 -1 potenciales, entonces podríamos medir los
3 586 583 3 efectos causales de los pequeños sobre la
4 661 661 0 lectura a nivel individual. (A d v e r t e n c i a :
5 614 602 12 Aquí inventamos los valores de los
6 607 610 -3 resultados potenciales no observados,
mostrados en grag, para ilustrarq los efectos
causales individuales).

Basándonos en la tabla 2.1, concluiríamos que asistir a una clase


pequeña frente a u n a de tamaño normal:
- ha aumentado la puntuación en lectura del primer alumno en 7 CONSEJO: Al interpretarq el signo de los
efectos causales, debemos interpretar:
puntos, la del tercer alumno en 3 puntos y la del quinto alumno
- un efecto positivo, ya que el
en 12 puntos tratamiento provoca un aumento de la
- disminuyó la puntuación de lectura del segundo alumno en 1 variable de resultado.
punto y la del sexto alumno en 3 puntos. - un efecto negativo, ya que el tratamiento
provoca una disminución de la variable de
- no tuvo ningún efecto en la puntuación de lectura del cuarto resultado.
alumno. - un efecto de cero como el tratamiento
que no causa ningún cambio en la variable
de resultado.
Tenga en cuenta que el mismo tratamiento puede tener efectos
diferentes para individuos diferentes. Además, tenga en cuenta que,
dado que un efecto causal es una medida de cambio, debemos
interpretar un efecto causal como un aumento si es positivo, como
una disminución si es negativo y como sin efecto si es cero. (Véase
la PISTA al margen).
32 CAPÍTULO 2

Por desgracia, este tipo de análisis no es posible. En el mundo


real, nunca observamos los dos resultados potenciales del
mismo individuo. En su lugar, sólo observamos el " -", que es
el resultado potencial en cualquier condición (tratamiento o
control) que se haya recibido en el ensayo. Nunca podemos
observar el .
i : - - , que es el resultado potencial que se habría producido
en cualquiera de las condiciones (tratamiento o control) que no
se recibió en realidad. Como resultado, no podemos calcular los
efectos causales a nivel individual. En nuestro ejemplo, un
estudiante asiste a una escuela de tamaño medio o a una de
tamaño normal durante los primeros años escolares, pero no
puede entrar en un universo paralelo para asistir a ambas a la
vez (véase la figura 2.1). (Véase la figura 2.1.)

FIGURA 2.1. Si un individuo pudiera


dividirse en dos seres idénticos, y cada
uno de ellos pudiera recibir una
condición diferente, entonces podríamos
observar el resultado bajo la condición de
tratamiento y el resultado bajo la
condición de control para el mismo
individuo. Entonces podríamos
calcular el efecto causal del tratamiento
sobre el resultado para este individuo
específico bq simplemente midiendo la
diferencia entre los dos resultados

Para cada alumno del Proyecto STAR, por ejemplo, sólo


observamos una puntuación en el examen de lectura de tercer
curso, la obtenida después de que el alumno asistiera realmente
a uno de los dos tipos de clases. Como resultado, no podemos
medir cómo afectó el tamaño de la clase al rendimiento de cada
alumno en el examen redding. (Véase la tabla 2.2, en la que los
resultados de las seis primeras observaciones se indican como
...porque no fueron observados).

TABLA 2.2. Valores de pequeño, lectura, i pequeñ lectura lectura(smaII--1) lectura(pequeño--0)


o
reading(small=) ), y reading(smoff=0)
para las primeras observaciones stx en el STAR 1 1 578 578 ???
conjunto de datos. Resultados potenciales no 2 0 612 //? 612
observados,
o contrafactuales, se indican como * ^? 3 0 583 //? 583
4 1 661 661 ?/?
? 1 614 614 ?/?
EXPERIMENTOS 33
ALEATORIOS

0 0 610 //? 610


34 CAPÍTULO 2

Tomemos el primer alumno, la observación cuando i 1. El valor


de sm-!!1 es 1, lo que significa que este alumno asistió a una
clase pequeña. El valor de readin91. entonces, indica el
rendimiento de este alumno en la prueba de lectura después de
asistir a una clase pequeña (reCfding1 (smCf//1 1)=578). La
puntuación de 578 puntos es el resultado factual de este
alumno porque sí lo observamos. Lo que no observamos es
el resultado contrafactual, es decir, cómo le habría ido a este
alumno en el examen de lectura después de asistir a una clase
de tamaño normal (reCfding (smCf//11 0)=???). En
consecuencia, no podemos medir el efecto que tuvo la
asistencia a una clase pequeña en la puntuación obtenida por
este alumno en l a p r u e b a d e l e c t u r a :

D reading1 -- reading1(smCf//1 1) - reading1(smo//1 =0) 578 - '!'/'! -


'!'!'!

El problema fundamental al que nos enfrentamos a la hora de Sólo observamos lo que ocurre en la
inferir efectos causales es que nunca observamos al mismo realidad (el resultado factual). Nunca
individuo recibiendo el tratamiento y sin recibirlo a l mismo podemos observar lo que habría
ocurrido si hubiéramos tomado
tiempo. decisiones diferentes (el resultado
contrahecho).

I" I . xa. v1I" 1. i f'u'Jn I I" 1 'ml- r 1.. s. I I I" I" III x(" 1-
111 II'I-. 51Ir \ ' ' .I Iz 5.1l I-lfI'' 15. \\ I- I1I-I'J\ I I' 1 I'II .|'.1r'' 17IJ' !.II It I.Il JLII' IDIII
I' As I I I -tI'' I L/IJI I1''r I I' I IJrll 'IUI I I IIII-, VIII I \\ L- E I I I IL'VL-I U1131' ¥f- 1tI1' I
LJIJI I1''r Ic" I IJnil EILIII 011\1'

Para sortear el problema fundamental de la inferencia causal, RECUERDE: La media de una variable es
igual a la suma de los valores de todas las
debemos encontrar buenas aproximaciones para los resultados
observaciones dividida por el número de
contrafactuales. Para lograrlo, nos alejamos de los efectos a observaciones. A menudo se representa
nivel individual y nos centramos en el efecto causal medio en un con el nombre de la variable y una barra en
grupo de individuos. la parte superior.

¡El .- , i- .-! - "I -. uf tin' lit-a-rM''iii A en el resultado V, también


knuwi Ja rlJe : . . -;- : . :: , es la media de
todos los efectos causales individuales de X sobre Y dentro de un
grupo. Dado que cada efecto causal individual es el cambio en V
causado por un cambio en X para un individuo concreto, el
efecto causal medio de X sobre V es el cambio medio en Y
causado por un cambio en X para un grupo de individuos.

Si pudiéramos observar ambos resultados potenciales para cada


individuo del grupo, entonces podríamos medir los efectos
causales individuales (utilizando la fórmula 2.1) y calcular el
efecto causal medio como se muestra en la fórmula 2.2.
EXPERIMENTOS 35
ALEATORIOS

FÓRMULA 2.2. Definición del efecto


causal medio de un tratamiento sobre un
resultado, o efecto medio del tratamiento.

Volvamos al escenario idealizado en el que podríamos observar


ambos resultados potenciales para cada uno de los seis primeros
alumnos d e l conjunto de datos STAR. Como vimos anteriormente,
si los resultados potenciales fueran los que se muestran en la tabla
2.1, los efectos causales individuales de los pequeños en la lectura
para estos alumnos serían:

defectos_individuales -- (7, -1,3, 0, 12, -3)

Entonces, el efecto causal medio de los pequeños sobre la lectura


sería:
n
individual_eifects;
efectos_individuales i1
número de estudiantes

7 (-1) 3 012 + (-3) 18


=3
6 6

Llegaríamos a la conclusión de que, entre los seis primeros


alumnos del Proyecto STAR, asistir a una clase pequeña, en
lugar de a una de tamaño normal, mejoró el rendimiento del
alumno en la prueba de lectura en una media de 3 puntos.
Recuerde, sin embargo, que este tipo de análisis no es posible
porque nunca observamos ambos resultados potenciales para el
mismo individuo. Por lo tanto, tampoco podremos calcular
directamente los efectos causales medios.

¿Cómo podemos obtener buenas aproximaciones de los


resultados contrafactuales, que por definición no se pueden
observar? Como veremos en detalle más adelante, debemos
encontrar o crear una situación en la que las observaciones
tratadas y las no tratadas sean similares con respecto a todas
las variables que puedan afectar al resultado, aparte de la
propia variable de tratamiento. La mejor manera de lograrlo
es realizar un experimento aleatorio.
EXPERIMENTOS 35
RANDOiVlZADOS

I I- is - i . 11 PM kIzI'vs I - a5 r1 r . III li3lTttZed C0n-


En un ensayo controlado aleatorio (ECA), los investigadores
deciden quién recibe el tratamiento basándose en un proceso
aleatorio.

Por ejemplo, en el Proyecto STAR, los investigadores podrían


haber lanzado una moneda al aire para decidir si un alumno
asistiría a una clase de tamaño pequeño o normal. Si sale cruz,
el alumno será asignado a u n a c l a s e d e t a m a ñ o normal.
(Véase la figura 2.2.)

FIGURA 2 2. Una forma de asignar el


tratamiento al azar consiste en lanzar una
moneda por cada individuo del estudio.
Si la moneda sale cara, el individuo se
asigna al grupo de tratamiento. Si sale
cruz, se le asigna al grupo de control.

Cara Cruz

En la práctica, los investigadores no lanzan monedas, sino que


utilizan un programa informático como R para asignar
aleatoriamente un 1 o un 0 a cada individuo. Los individuos a los
que se asigna un 1 reciben el tratamiento, y los individuos a los
que se asigna un 0 no reciben el tratamiento.

Una vez asignado el tratamiento, podemos diferenciar entre dos


grupos de observaciones:

- el -i- : - consiste en los individuos que recibieron el


tratamiento (el grupo de observaciones para las que A;=1)
- el - . ¡! -: . consiste en los individuos que no recibieron
el tratamiento (el grupo de observaciones para las que A;=0).

En el Proyecto STAR, los alumnos que asisten a clases


reducidas constituyen el grupo de tratamiento. Los alumnos que
asistieron a una clase de tamaño normal son el grupo de control.
36 CAPÍTULO 2

Cuando la asignación al tratamiento es aleatoria, lo único


que distingue al grupo de tratamiento del grupo de control,
además de la recepción del tratamiento, es el azar. Esto
significa que, aunque los grupos de tratamiento y de control
estén formados por individuos diferentes, los dos grupos son
comparables entre sí, por término medio, en todos los aspectos
salvo en el hecho de haber recibido o no el tratamiento.

La asignación aleatoria del tratamiento hace que los grupos de


tratamiento y de control sean, por término medio, idénticos entre
sí en todas las características observadas y no observadas
CONSEJO: Una característica no previas al tratamiento. i . .. ' . ':
observada es una característica que no - son las características de los individuos de un estudio
hemos medido. antes de que se administre el tratamiento. (Por definición, las
características previas al tratamiento no pueden verse afectadas
por éste).

Por ejemplo, en el Proyecto STAR, dado que el tratamiento se


asignó aleatoriamente, la edad media del grupo de tratamiento -
los alumnos que asistieron a una clase de tamaño reducido-
debería ser comparable a la edad media del grupo de control -los
alumnos que asistieron a una clase de tamaño normal-.

Volvamos a la fórmula del efecto medio del tratamiento. Si


pudiéramos observar los dos resultados potenciales de cada
individuo, podríamos calcular los efectos causales individuales
(utilizando la fórmula 2.1), y el efecto medio del tratamiento
sería igual a la diferencia media entre los dos resultados
potenciales:

CONSEJO: Utilizando los valores de la efecto_medio efectos_individuales -- Y(X=1) - V(A--0)


tabla siguiente, podemos confirmar que
la media de la diferencia entre X e Y es
igual a la diferencia entre la media de A y Según las reglas de la suma, la media de una diferencia es
la media de V: igual a la diferencia de medias. (Esto nos permite reescribir el
efecto medio del tratamiento:
X Y X-Y
4 2 2
efecto_medio V(X 1) - Y(X=0) Y(X=1 ) - V(A=0) donde:
2 10 4 6
medias 7 3 4 Y(X=1) es el resultado medio bajo la condición de tratamiento
en todas las observaciones
Y(X=0) es el resultado medio en la condición de control de todas
las observaciones.
EXPERIMENTOS 37
ALEATORIOS

Lamentablemente, no podemos calcular el efecto medio del


tratamiento porque, como recordará, nunca observamos los dos
resultados potenciales de cada individuo. Por lo tanto, no podemos
calcular ni el resultado medio bajo la condición de tratamiento en
todas las observaciones ni el resultado medio bajo la condición de
control en todas las observaciones. Todo lo que podemos observar
es el resultado medio del grupo de tratamiento después de recibir
el tratamiento y el resultado medio del grupo de control después
de no recibir el tratamiento.

Sin embargo, si los grupos de tratamiento y control eran


comparables antes de administrar el tratamiento, podemos utilizar
el resultado factual de un grupo como aproximación al resultado
contrafactual del otro. En otras palabras, podemos suponer que el
resultado medio del grupo de tratamiento es una buena estimación
del resultado medio del grupo de control si éste hubiera recibido el
tratamiento. Del mismo modo, podemos suponer que el resultado
medio del grupo de control es una buena estimación del resultado
medio del grupo de tratamiento si éste no hubiera recibido el
tratamiento. Como resultado, podemos aproximar el efecto medio
del tratamiento bg calculando la diferencia en los resultados
medios entre los grupos de tratamiento y de control. Dado que
ambos resultados medios se observan, podemos realizar este
análisis.

En resumen, si los grupos de tratamiento y control se compararon


antes de administrar el tratamiento, podemos estimar el efecto
causal medio del tratamiento X sobre el resultado V con la
fórmula
.. t. ctlII'If In krI'I.DII .II 1TI'' ' ' ' ' -- ' i ' : i -! i

CONSEJO: Para estimar los efectos


causales, es necesario contar con un
grupo de tratamiento y un grupo de
control. En otras palabras, no basta con
observar a un grupo de individuos que
recibieron el tratamiento; también
necesitamos observar a un grupo de
individuos que no recibieron el
tratamiento.

Nótese que el "sombrero" encima del nombre denota que se trata


de una estimación, es decir, un cálculo basado en aproximaciones.
Las estimaciones, incluida ésta, contienen cierta incertidumbre.
(Veremos cómo cuantificar esta incertidumbre en el capítulo 7).
38 CAPÍTULO 2

Merece la pena repetir que la diferencia de medias es un


estimador válido del efecto causal medio de un tratamiento
sobre un resultado cuando los grupos de tratamiento y control
son comparables con respecto a todas las variables que pueden
afectar al resultado, aparte de la propia variable de tratamiento.
Como ya se ha dicho, esto se consigue mejor en experimentos
como el Proyecto STAR, en el que el tratamiento se asigna
aleatoriamente. La asignación aleatoria del tratamiento permite a
los investigadores aislar el efecto del tratamiento de los efectos
de otros factores.

I -/1t' -/ /1"" /1 I'\14.1n t/. Fig LU iri'j i .i5i'l i#iii £rfl'¥i I iii i' i^l
-r55ri |i M M''i i i1 ".\ t' i rlri riwiJiili" I l1a- \ I is' \ r i I ii ii "i if isiHI E 'i-i I i ul III
CILI§ t'> W4'f 1 1 IDII '|3rgI <Igf!4' tI4'*UI 4' 18I4' <I4 III III i5 I I c11 IEIf I €I# r IL
I i ''-1Jzii''. i I . 45 " s i-5ril1, \¥ r- ' <i it r I' fly cut I l1\- s! i1l''r r i i i- i it
¡iii1'-i i: > 1'xEi ii dejar Ui 1¢i | 3 r 'i'. irl'' a x en él! I'm I i iii+i I r ¢i^ I l1i- <i-.'' : aijr-
Ire.\1'iicn i rlfr'r.

Por desgracia, no siempre podemos realizar un experimento. Hay


tres tipos de obstáculos que pueden impedirnos realizar uno:
Ética: No sería ético aleatorizar determinados tratamientos, como
un fármaco potencialmente letal.
Logística: algunos tratamientos, como la estatura o la raza, no
pueden manipularse fácilmente.
Financieros: Los experimentos suelen ser caros. Coste del proyecto
STAR
muchos millones de dólares, por ejemplo.

Dado que no siempre podemos realizar experimentos, tenemos


que aprender a estimar los efectos causales en entornos no
experimentales, utilizando lo que se denomina. ..- ' -- ' . '. A
diferencia
de ..:
que se refiere a los datos recogidos de un experimento
aleatorio, los datos observacionales se recogen sobre
acontecimientos que ocurren de forma natural. La asignación del
tratamiento está fuera del control de los investigadores y suele
ser el resultado de elecciones individuales. Por ejemplo,
podemos querer estimar el efecto causal medio de las clases
pequeñas sobre el rendimiento de los alumnos recopilando datos
de distritos escolares en los que el tamaño de las clases varía
como resultado de factores como los presupuestos escolares, la
matriculación de alumnos o las limitaciones físicas de los
edificios escolares. En este tipo de estudios, conocidos como : .-
i '-
tenemos que encontrar un truco estadístico para que los grupos
de tratamiento y de control sean comparables sin depender de
la asignación aleatoria del tratamiento. Aprenderemos a
hacerlo en el capítulo 5.
EXPERIMENTOS 39
ALEATORIOS

Ahora que sabemos que, al analizar el conjunto de datos STAR,


podemos utilizar el estimador de diferencia de medias para
estimar el efecto causal medio de las clases pequeñas sobre el
rendimiento de los alumnos, es el momento de realizar el
análisis.
40 CAPÍTULO 2

Para seguir el análisis de este capítulo, puede crear un nuevo CONSEJO: Si estás comenzando una
script de R en RStudio y practicar el código usted mismo. nueva sesión de R, para operar con los
También puede abrir "Experimental.R" en RStudio, que contiene datos, necesitas volver a ejecutar parte
del código que escribimos en el capítulo
todo el código de este capítulo. Comenzamos el análisis anterior, espectficallg los ltnes de código
ejecutando el siguiente código del capítulo anterior: que:

twd() si Mac - e s t a b l e c e r e l directorio de


trabajo en la carpeta que contiene el
' # setwd() il Windows conjunto de datos que utiliza la función
leer el conjunto de datos utilizandoy
4 lee y almacena datos almacenarlo como un objeto llamado
star utilizando el operador de
asignación
' -i ' - - 4 muestra ñr primeras observaciones
Si la carpeta DSS se guarda
44 classtq pe lectura matemáticas graduado
directamente en su Escritorio. (Tenga en
441 pequeño378 610 1 cuenta que en el código para ordenadores
Windows, debe sustituir usuario por su
propio nombre de usuario). Si la carpeta
DSS está guardada en otro lugar, por favor
44 2 regular 612 612 1 consulte las instrucciones en la en
subsección 1.7.1
44 3 regular 383 606 1 cómo establecer el directorio de trabajo.
44 4 pequeñ 661 648 1
o
44 5 pequeñ 614 636 1
o
44 6estamos
Aquí, regularinteresados
610 603 0 conjunto de datos para
en utilizar este
estimar el efecto causal medio de asistir a una clase pequeña sobre
tres medidas diferentes del rendimiento de los estudiantes:
lectura, matemáticas y graduado. Para cada variable de resultado,
necesitamos realizar un análisis separado. Dado que el Proyecto
STAR fue un experimento aleatorio, podemos utilizar el estimador
de diferencia de medias para estimar cada uno de los tres efectos
medios del tratamiento.

Antes de poder calcular los estimadores de diferencia de medias,


tenemos que aprender a utilizar los operadores relacionales, que
nos permiten crear y subconjuntar variables.

Hay muchos operadores relacionales en R que se pueden


utilizar para establecer una prueba lógica. En este libro,
utilizamos sólo el operador , que evalúa si dos valores son
iguales entre sí. Si lo son, R devuelve el valor lógico TRUE. Si
i..xi >'
no lo son, R devuelve el valor lógico FALSE. (TRUE y FALSE no
son valores de carácter. Son valores especiales en R, con un
significado específico, y por lo tanto no se escriben entre
comillas). Por ejemplo, si ejecutamos

## t1] TRUE
EXPERIMENTOS 41
ALEATORIOS

R nos hace saber que efectivamente 3 es igual a 3. Si en cambio ejecutamos:


42 CAPÍTULO 2

##/1]FALSE

R devuelve un FALSE, indicando que 3 no es igual a 4.

RECUERDE: En el conjunto de datos Podemos aplicar operadores relacionales a todos los valores de
STAR, la variable closstqpe tdenttfies la una variable a la vez. En este caso, R considera el valor de cada
clase a la que asistió el alumno. En R, observación uno a uno y devuelve un VERDADERO o un FALSO
utilizamos el carácter para acceder a una
variable dentro de un marco de datos. A la
para cada uno de ellos. Por ejemplo, si quisiéramos determinar
izquierda, vemos el nombre del objeto qué alumnos del conjunto de datos STAR asistieron a una clase
donde se almacena el marco de datos (sin pequeña, ejecutaríamos
comillas). A la derecha, vemos el nombre
de la variable (sin comillas). Ejemplo: Se
## t1] TRUE FALSE FALSE TRUE TRUE FALSE ##
utilizan comillas para los valores de texto,
pero no para los valores numéricos. En la t7] TRUE TRUE FALSE FALSE FALSE
salida, los números entre paréntesis al
principio de cada línea indican la posición
de la observación correspondiente a la Después de ejecutar el código anterior, R devuelve tantos valores
derecha. lógicos como observaciones en la variable classtype. (Aquí
mostramos gou sólo los primeros 1 2.) Para los estudiantes que
asistieron a una clase pequeña, R devuelve TRUE porque el valor
de classtgpe es igual a "small". Para los estudiantes que no
asistieron, R devuelve FALSE. Por ejemplo, como vimos en la
salidade más arriba, el valor declasstgpe para la
primera observación es "pequeño", y por lo tanto, aquí R devuelve
TRUE como primera salida.

Ahora podemos pedir a R que realice una acción diferente


dependiendo de los resultados de una prueba lógica (el
VERDADERO o FALSO devuelto al aplicar el operador). Por
ejemplo, podemos pedir a R que produzca valores para una
nueva variable o que extraiga valores específicos de una variable
existente en función de los resultados de la prueba lógica.

I:x m'¡ it - I m' iioi- . . a, UM I i x1 ii Us para "si la prueba lógica es


verdadera",
return this, else return that," podemos crear el contenido de una
nueva variable basándonos en si los valores de una variable
existente pasan una prueba lógica. Por ejemplo, podemos crear el
contenido de una nueva variable binarg basándonos en los valores
de classtgpe. Para los alumnos cuyo valor de classtype sea igual a
"small", pedimos a R que devuelva un 1, y para todos los demás
alumnos un 0.

La función requiere tres argumentos:


— La primera es la prueba lógica, que especifica la pregunta
verdadero/falso que sirve de criterio para crear el contenido de
la nueva variable. En la aplicación actual, para cada alumno,
queremos evaluar si el valor de classtype es igual a "small".
Como se muestra arriba, el código
lo consigue.
— El segundo argumento es el valor que queremos que devuelva la
EXPERIMENTOS 43
ALEATORIOS

función cuando la prueba lógica sea verdadera. En este caso,


queremos que el valor de retorno sea un 1 siempre que
classtqpe sea igual a "small".
44 CAPÍTULO 2

El tercer argumento es el valor que queremos que devuelva la


función cuando la prueba lógica sea falsa. En este caso, queremos
que e l v a l o r d e retorno sea un 0 siempre que classtqpe no sea
igual a "small".

Ejecute el siguiente código: quinta observaciones, el valor de


classtgpe es "small" y el valor de small
es 1. En la segunda, tercera y sexta
44 t1] 1 0 0 1 1 0 1 1 0 0 0 0 observaciones, el valor de classtgpe es
"regular" y el valor de smrt// es 0.

La función devuelve un 1 o un 0 para cada alumno del


conjunto de datos STAR en función del tgpe de clase a la que
asistió. (Aquí también le mostramos onfg los 12 primeros
valores).

Para almacenar estos valores como una nueva variable,


utilizamos el operador de asignación . A su izquierda, tenemos
que especificar el nombre de la nueva variable. En este caso,
elegimos llamar a la variable small. Para almacenarla como una
variable dentro del marco de datos y no sólo como un nuevo
objeto bg en sí mismo, necesitamos identificar el nombre del
marco de datos antes del nombre de la variable con el
c a r á c t e r en medio. (Nótese que el carácter - nos permite
crear una nueva variable, y no sólo acceder a una existente
como vimos en el capítulo 1).

Poniendo todo junto, para crear la nueva variable pequeña ejecutamos:

Siempre que cree una nueva variable, es una buena práctica


comprobar su contenido. Hacerlo puede ahorrarle muchos
problemas en el futuro. Por ejemplo, aquí podemos echar un
vistazo rápido a las primeras observaciones del marco de
datos utilizando - para asegurarnos de que la nueva variable
binarg se ha creado correctamente.
' -i ' - -4muestra las primeras observaciones
44 classtqpe lectura matemáticas graduado pequeño
44 1 pequeñ 378 61 0 1 1
o
44 2 reg ufar 612 612 1 0
44 3 reg ufar 383 606 1 0
44 4 pequeñ 661 648 1 1
o
44 5 pequeñ 61 4 636 1 1
o
44 6 reg ufar 61 0 603 0 0

Observando el resultado, podemos ver que tenemos una nueva


variable llamada small. Comparando l o s valores de small con los
valores de classtgpe, podemos confirmar que siempre que classtqpe
es igual a "small", small es igual a 1 y que siempre que classtqpe es
igual a "regular", small es igual a 0. En efecto, en la primera, cuarta y
EXPERIMENTOS 45
ALEATORIOS

CONSEJO: Aquí, el primer valor de retorno t s a 1 y el segundo ts a 0.


¿Por qué? En la primera observación del conjunto de datos STAR, classtqpe
es igual a "pequeño", por lo que la prueba lógica ts TRUE, y p o r lo tanto,
la función devuelve un 1. En la segunda
observación, classtqpe es igual a "regular", por lo que la prueba lógica ts
FALSE, y por lo tanto, la función
devuelve un 0.

CONSEJO: Recuerde que el nombre de un objeto o variable puede ser


cualquier cosa, siempre que no empiece por un número ni contenga
espacios o símbolos especiales como $ o °é. Por razones prácticas, el
nombre de un objeto o variable debe reflejar el significado de su contenido,
ser corto y escribirse en m i n ú s c u l a s .
46 CAPÍTULO 2

L:- i'j <q i'\r - l'i \r L''1 , r ' ari c' -traer la selección de observa-
ciones para las que una prueba lógica es verdadera. Esto
resulta útil en diversas situaciones. Por ejemplo, para estimar el
efecto causal medio de los pequeños sobre la lectura,
necesitamos calcular el siguiente estimador de diferencia de
medias:

puntuación media puntuación media


en las pruebas de en las pruebas de
lectura de los lectura de los
alumnos de alumnos de
clases pequeñas clases de tamaño normal

Esta fórmula requiere calcular las medias de dos subconjuntos


de observaciones ol lectura para los que se cumple un
determinado criterio. Para subconjuntar una variable, utilizamos
el operador A su izquierda, especificamos la variable que
queremos subconjuntar, '- - ' . - en este caso. Dentro de los
corchetes, especificamos el criterio de selección. Los ejemplos
siguientes le aclararán e l funcionamiento.
RECUERDA: calcula la media de una
variable. El único argumento necesario Como se indicó en el capítulo anterior, podemos utilizar la función .
es el código que identifica la variable. para calcular la media de una variable en R. Para calcular las
Ejemplo:
puntuaciones medias de lectura entre todos los estudiantes del
conjunto de datos STAR, ejecutamos:
4 calcula la media de la lectura
## /1 628.803

Para calcular las puntuaciones medias de lectura sólo entre los


alumnos que asistieron a una clase pequeña, necesitamos
incluir en la media sólo las observaciones de lectura para las
que pequeña es igual a 1. El siguiente código lo consigue:
4 para el grupo de tratamiento

Valores de pequeño y lectura para las Para el cálculo de la media se seleccionan todas las
primeras stx observaciones en el observaciones de lectura para las que la prueba lógica
conjunto de datos STAR. Las especificada entre corchetes es verdadera. Por ejemplo, entre
observaciones de los alumnos que
asistieron a una clase pequeña (smo//-1) las seis primeras observaciones del conjunto de datos, onfg los
aparecen en negro, y las observaciones valores de lectura que corresponden a las observaciones 1, 4 y
de los alumnos que asistieron a una 5 se incluyen en esta media. (Véase la tabla al margen.) Según
clase normal (smo//=0) aparecen en gris. el resultado anterior, los alumnos que asistieron a una clase
pequeña obtuvieron una media de 633 puntos en la prueba de
i lectura lectura.
peque
ño ¿Qué ocurre con los alumnos que asistieron a una clase de
1 1 578 tamaño normal? El código para calcular esta media es idéntico
2 0 612 al anterior, salvo que ahora el criterio de inclusión es que
3 0 583 pequeño debe ser igual a 0.
4 1 661
5 1 614 4 para el grupo de control
6 0 610
EXPERIMENTOS 47
ALEATORIOS

## t1] 625.492

Según este resultado, los alumnos que asistieron a una clase de


tamaño normal obtuvieron unos 625 puntos de media en el examen
de lectura.
48 CAPÍTULO 2

Ahora podemos calcular fácilmente el estimador de diferencia en


medias como la diferencia entre estas dos medias utilizando las
salidas anteriores ( . ). Mejor aún, podemos calcularlo todo de
una vez, bg ejecutando el siguiente trozo de código:
44 calcular el estimador de la diferencia de medias para la lectura CONSEJO: Por convención, cuando
incluimos en el scrtpt R un comentario al
principio de un ltne, en lugar de después de
algún código, utilizamos dos caracteres #
## t1] 7.210547 en lugar de uno.

Para las otras dos variables de resultado, podemos calcular los


correspondientes estimadores de diferencia de medias de la
siguiente manera:
44 calcular el estimador de la diferencia de medias para matemáticas

## t1] 5.989905

44 calcular el estimador de diferencia de medias para graduados CONSEJO: Las buenas conclusiones son
claras, concisas e incluyen los
elementos clave del análisis. Por
ejemplo, cuando se calculen los efectos
## t1] 0.007031124 causales medios con experimentos en
serie, asegúrese de transmitir:
Estos dos trozos de código son idénticos al anterior, salvo que el supuesto: los grupos de tratamiento
y de control son comparables en
ahora utilizamos matemáticas y graduado, respectivamente, en
función de las características
lugar de lectura como variable de resultado de interés. previas al tratamiento; en este caso,
los alumnos que asistían a clases
¿Qué podemos concluir de estos resultados? Suponiendo que reducidas eran comparables antes de
los alumnos que asistían a clases reducidas fueran comparables la escolarización a los que asistían a
antes de la escolarización a los que asistían a clases de tamaño clases regulares.
normal (una suposición razonable dado que el conjunto de datos la justificación de la hipótesis: el
conjunto de datos procede de un
procede de un experimento aleatorio), estimamos que asistir a experimento aleatorizado
clases reducidas: el tratamiento: asistir a una clase
pequeña la(s) variable(s) de
aumentó el rendimiento de los alumnos en la prueba de lectura resultado
de tercer curso en 7 puntos de media puntuacion
el rendimiento de los alumnos en el examen de matemáticas de es en las pruebas de lectura de tercer
curso, puntuaciones en las pruebas de
tercer curso aumentó 6 puntos de media matemáticas de tercer curso y
- aumentaron la proporción de estudiantes que terminan el proporción de alumnos que se
b a c h i l l e r a t o en aproximadamente 1 punto porcentual, gradúan en un centro de enseñanza
por término medio. superior
la densidad, el tamaño y la unidad de
medida del efecto o efectos causales: un
Tenga en cuenta que las conclusiones deben mencionar los aumento de 7 puntos porcentuales, un
aumento de 6 puntos porcentuales y un
elementos clave del análisis. (Además, tenga en cuenta que la aumento inferior a un punto
unidad de medida de la estimación de la diferencia de medias porcentual, respectivamente.
difiere según el tipo de variable de resultado. Véase el resumen el hecho de que está haciendo una
proporcionado en el esquema 2.1. (Al igual que hicimos al afirmación causal: utilice un lenguaje
discutir la interpretación de las medias en el capítulo 1, causal (asistir a una clase pequeña
aumenta el rendimiento de los
excluimos las variables categóricas de esta discusión). alumnos) en lugar de un lenguaje
observacional (los alumnos que asisten
a una clase pequeña rinden más que
los que asisten a una clase normal).
el hecho de que usted esté estimando
EXPERIMENTOS 49
ALEATORIOS

efectos causales medios en contraposición a efectos causales


tndtvtduales.
50 CAPÍTULO 2

ESQUEMA 2.1. Untt de medida del estimador \i fl i1 Al lli P 1 Hi €''il6rl I De Ella' £l ifiCi I'll\-- i ii - li' Sri i\l I'lliiil'1 lote
de la diferencia-tn-medias basado en el tqpe
de la variable de resultado.

rl-I I (1g All fllt' i'i | 'yrr{' iiI.Mgr {iq.rile


i8i i1 Ol lli P'I6!JfC^!£'!11 \1sei ii'.tit tiplLp iJq
os 1 li i" uiJ\' 'i:ii'' ¥"'i i a Uh'' I I IL" £ I'1IJIE gl I| I /(t|

Si la variable de resultado no es binaria, la unidad de medida del


estimador de diferencia de medias será la misma que la unidad de
medida de la variable de resultado. Por ejemplo, si la variable de
resultado se mide en puntos, como es el caso de la lectura y las
matemáticas, e n t o n c e s los resultados medios de los grupos de
tratamiento y control también estarán en puntos (la media de
puntos se mide en puntos) y también lo estará el estimador
(puntos-puntos==puntos).

CONSEJO: ¿Qué es un porcentaje? Es Si la variable de resultado es binaria, la unidad de medida del


la unidad de medida de la diferencia estimador de diferencia de medias serán los puntos porcentuales,
aritmética entre dos porcentajes. Por
a veces abreviados como p.p. (después de multiplicar el resultado
ejemplo, si la proporción de respuestas
correctas de un alumno en un examen bq 1 00). ¿Por qué?
mejoró de 50°é a 60°é, diríamos que la
puntuación aumentó en 10 puntos
En primer lugar, como se explicó en el capítulo anterior, la
porcentuales: media de una variable binarg debe interpretarse como un
A puntuación - puntuación#"t -
porcentaje (después de multiplicar el resultado bg 100), porque
puntuación",t "t equivale a la proporción de las observaciones que tienen la
=10 característica iden- tificada por la variable. En consecuencia,
cuando la v a r i a b l e d e resultado es binaria, como en el caso
¿Por qué esta diferencia no se de los graduados, los resultados medios de los grupos de
denomina 10°? Porque el cambio tratamiento y control se medirán en porcentajes (después de
porcentual es diferente del cambio
porcentual potnt. Si alguien nos dijera multiplicar el resultado por 100).
que la puntuación inicial era 50° y que En segundo lugar, la unidad de medida de la diferencia
aumentó 10°, la puntuación final sería aritmética entre dos porcentajes es el punto porcentual
55° (no 60° ). Como un aumento d e 1 0 '
(porcentaje-porcentaje==punto porcentual). (Por lo tanto, si la
de 50' es un aumento de 5 potnts
porcentuales (0,10x 50=5 p.p.), la variable de resultado es binaria, el estimador de la diferencia de
puntuación final sería: medias se medirá en puntos porcentuales (después de
score#"t = score",t "t -|- Ascore multiplicar la salida bg 1 00).
= 50° + 5 p.p. = 55°
A modo de ejemplo, revisemos la interpretación del estimador de
diferencia de medias para la variable binaria graduada.

En primer lugar, calcule la media de graduados de los alumnos que


asisten a una clase pequeña y de los que asisten a una clase de
tamaño normal, por separado:
" 4para el grupo de tratamiento
44 t1] 0 8733043

" 4para el grupo de control


44 t1] 0 8664731
EXPERIMENTOS 51
ALEATORIOS

La salida superior indica que entre los estudiantes que asistieron


a una clase pequeña, la tasa media de graduación en secundaria
fue de 87,35°é (0,8735x 100=87,35°é). La salida inferior indica
que entre los estudiantes que asistieron a una clase de tamaño
normal, la tasa media de graduación en secundaria fue de
86,65°é (0,8665 x 100=86,65°+).

En segundo lugar, calcule el estimador de diferencia de medias,


que es la diferencia entre las dos medias anteriores:
## difference-in-means for graduated

## t1] 0.0070312

Como ya sabíamos por nuestros cálculos anteriores, el estimador que nos hayamos familiarizado con
de diferencia de medias para graduado es igual a 0,007. Debe los conceptos pertinentes.
interpretarse como un aumento de la probabilidad de graduarse
en el instituto de 0,7 puntos porcentuales de media (0,007 x 100
0 ,7 p.p. u 87,35°é-86,65°é 0,7 p.p.).

Ahora que hemos aclarado cómo interpretar el estimador de la


diferencia de medias, volvamos a nuestras estimaciones
anteriores de los efectos medios del tratamiento. Estas
estimaciones tienen dos advertencias:

En primer lugar, lasg indican en qué medida cambia el


resultado medio de varios individuos como consecuencia del
tratamiento. No indican cómo afectaría el tratamiento al
resultado de un solo individuo. Como vimos en el escenario
idealizado al principio del capítulo, los efectos del tratamiento a
nivel individual pueden diferir significativamente de los efectos
medios del tratamiento. Aunque estimamos que el rendimiento
de los alumnos en el examen de lectura mejoró, en promedio,
como resultado de asistir a una clase pequeña, el rendimiento
de un alumno en particular podría haberse visto afectado.
En segundo lugar, la validez de estas estimaciones se basa
en la verosimilitud de la hipótesis de que los grupos de
tratamiento y control son comparables con respecto a todas
las variables que podrían afectar al resultado, aparte de la
propia variable de tratamiento. En este caso, podemos hacer
esta suposición con confianza porque estamos analizando
datos de un experimento aleatorio.

Aún nos quedan algunas preguntas por responder para


completar este análisis. Dos de ellas merecen especial atención:

¿Podemos generalizar estos resultados a una población de


estudiantes distinta de la que participó en el Proyecto STAR?
¿Los efectos causales estimados representan efectos
sistemáticos reales y no ruido en los datos?

Aprenderemos a responder al primer tipo de preguntas en el


capítulo 5 y exploraremos el segundo en el capítulo 7, una vez
52 CAPÍTULO 2

CONSEJO: Dado que un efecto causal medio estima el cambio medio tn


Y causado bq un cambio tn A, debe interpretarse como un aumento medio
tn Y "I postttve, como una disminución media tn Y "I negativa, y como
ningún cambio medio tn Y "I cero.
EXPERIMENTOS 53
ALEATORIOS

En este capítulo hemos aprendido sobre los efectos causales y


algunas de las dificultades a las q u e nos enfrentamos cuando
i n t e n t a m o s estimarlos.

Si pudiéramos observar los resultados del mismo individuo e n


condiciones de tratamiento y de control al mismo tiempo, podríamos
calcular el efecto causal del tratamiento sobre el resultado de un
individuo concreto como la diferencia entre estos dos resultados
potenciales.

Por desgracia, no es posible observar ambos resultados


potenciales. En realidad, sólo observamos el resultado bajo la
condición que recibió cada individuo (el resultado factual) y
nunca podemos observar lo que habría ocurrido si el individuo
hubiera recibido la condición opuesta (el resultado
contrafactual).

Para estimar un efecto causal, tenemos que basarnos en


supuestos para aproximarnos al resultado contrafactual. Esto nos
lleva a estimar los efectos medios del tratamiento en múltiples
individuos en lugar del efecto del tratamiento para cada
individuo.

Cuando los grupos de tratamiento y control son comparables,


podemos utilizar el resultado medio observado (el resultado
factual) de un grupo como una buena aproximación al resultado
medio no observado (el resultado contrafactual) del otro. En
estas circunstancias, el estimador de diferencia de medias
produce una estimación válida del efecto medio del tratamiento.

La mejor forma de garantizar que los grupos de tratamiento y


control sean comparables es realizar un experimento aleatorio.
Al asignar a los individuos al grupo de tratamiento o al de control
basándonos en un proceso aleatorio, como lanzar una moneda
al aire, nos aseguramos de que los dos grupos tienen, por
término medio, idénticas características antes del tratamiento.
Más adelante aprenderemos a estimar los efectos causales
medios cuando no podamos realizar un experimento aleatorio y,
en su lugar, debamos analizar datos observacionales.
54 CAPÍTULO 2

relación causal se refiere a la conexión de causa y efecto en este capítulo, exploramos la relación
entre dos variables en la que un cambio en causal entre asistir a una clase pequeña y el
una variable sgstematicallg produce un rendimiento de los alumnos:
cambio en la otra; representamos una
relación causal con una flecha entre las pequeño -+ rendimiento
variables:
La pregunta a la que pretendemos responder
es si asistir a una clase pequeña aumenta,
disminuye o tiene un efecto nulo sobre el
rendimiento medio de los alumnos.
variable de variable cuyo cambio maq producir en el proyecto STAR, la variable de tratamiento
tratamiento es
\x) cambio en la variable de resultado; pequeño, que definimos como:
variable donde se origina el cambio; en
este libro, la variable de tratamiento es 1si el estudiante i asistió
siempre binarq:
smalli - una clase pequeña
1si el individuo i
recibe el tratamiento 0 si el alumno i asistió
Xi = a una clase de
0 si el individuo i no tamaño normal
recibe el tratamiento
las variables de tratamiento son un tgpe
de la variable independiente
variable de resultado variable que puede cambiar como resultado en estas relaciones causales:
\ Y) de un cambio en la variable de tratamiento;
las variables de resultado son lo mismo que pequeño -+ lectura
las variables dependientes pequeño -+
matemáticas pequeño
-+ graduado
pequeño es la variable de tratamiento, y
lectura, matemáticas y graduado son l a s
variables de resultado
condición de la condición cuando el tratamiento está
tratamiento presente; condición cuando X/--1 en el Proyecto STAR, los alumnos que
asistían a una clase pequeña estaban bajo la
condición de tratamiento
la condición cuando el tratamiento está
condición de control ausente; condición cuando X/--0 en el Proyecto STAR, los alumnos que asistían a
una clase de tamaño normal estaban bajo la
condición de control
uno de los dos resultados potenciales para el
resultado potencial individuo i ; resultado potencial para el en el Proyecto STAR, el resultado potencial
bajo la condición de individuo i cuando el tratamiento está presente; bajo la condición de tratamiento es el
tratamiento el valor de V/ si X/--1 rendimiento del alumno después de asistir a
(Vi(X --1)) una clase pequeña desde el jardín de
uno de los dos resultados potenciales para el infancia hasta el tercer grado
resultado individuo i; resultado potencial para el
potencial en la individuo i cuando el tratamiento está ausente; en el Proyecto STAR, el resultado potencial
condición de el valor de V/ si X/--0 bajo la condición de control es el rendimiento
control del alumno después de asistir a una clase de
(V;(X;-0)) Letra griega Delta; notación matemática tamaño normal desde el jardín de infancia
del cambio hasta el tercer grado
& V/ representa el cambio en V para el
individuo i
EXPERIMENTOS 55
ALEATORIOS

efecto causal cambio en la variable de resultado V supongamos que el primer alumno d e l


individual de X causado bq un cambio en la variable de conjunto de datos (i-1) habría obtenido
sobre Y tratamiento X; si pudiéramos observar 720 puntos en la prueba de lectura después
ambos resultados p o t e n c i a l e s para de asistir a una clase pequeña, y 700
cada individuo, podríamos m e d i r l o puntos después de asistir a una clase de
como: tamaño normal; por lo tanto:
lectura1(pequeño1=1) = 720
individuaI_eiiectsi -- Yi(Xi--1)
lectura1(pequeño1=0) = 700
- Vt(Xt--0)
en este caso hipotético, el efecto causal
individual de asistir a una clase pequeña
sobre el rendimiento de este alumno en la
prueba de lectura habría sido:
efecto causal de los pequeños en la lectura --
-- Vi(Xi--1) - V (X --0)
-- lectura1( m0//1= 1)
lectura1(-maI!1'0)
=720 - 700 = 20
asistir a una clase pequeña, en lugar de
a una de tamaño normal, habría aumentado
el rendimiento de este alumno en la prueba
de lectura bq 20 puntos
resultado fáctico resultado potencial bajo cualquier condición si un alumno asistió a una clase reducida,
(tratamiento o control) recibida en la e l resultado factual es el rendimiento de
realidad; siempre observamos los resultados este alumno después de asistir a una clase
de hecho reducida, que observamos
resultado resultado potencial bajo cualquier condición si un alumno asistió a una clase pequeña, e l
contrafactual (tratamiento o control) no se recibió en resultado contrafactual es el rendimiento de
realidad; nunca observamos los resultados este a l u m n o después de asistir a una
contrafactuales clase de tamaño normal, que no
observamos
problema nunca observamos el resultado
fundamental de contrafactual; no podemos medir el efecto los alumnos asisten a clases reducidas o a
la inferencia causal individual de un tratamiento sobre un clases de tamaño normal, pero no pueden
causal resultado porque nunca observamos ambos asistir a ambos tipos de clases al mismo
r e s u l t a d o s potenciales; el efecto t i e m p o ; nunca podemos observar el
causal individual es V/(X/--1) - Y;(Xj-0), pero rendimiento de cada alumno en las
sólo podemos observar uno de los dos condiciones de tratamiento y de control y,
resultados potenciales, Y; (Xj--1) o por lo tanto, no podemos medir el efecto de
V;(X;-0), lo que ocurra en realidad asistir a clases reducidas en el rendimiento
de un alumno concreto.
efecto que X tiene sobre V a nivel agregado;
efecto causal media de los efectos causales individuales (véase estimador de diferencia de medias)
medio de X sobre deX sobre V en un grupo de observaciones:
Y n
o efecto medio del individual_eiiects;
1
tratamiento individuaI_eiiects --

cambio medio en la variable de resultado V


causado bq un cambio en la variable de
tratamientoX para un grupo de observaciones;
si los grupos de tratamiento y control eran
comparables antes de que se administrara el
tratamiento, entonces podemos estimar el
efecto medio del tratamiento utilizando e l
estimador de diferencia de medias
56 CAPÍTULO 2

experimento también conocido c o m o ensayo El proyecto STAR f u e un experimento


aleatorio controlado aleatorio (ECA); tipo de diseño aleatorio en el que los alumnos f u e r o n
de estudio en el que la asignación al asignados al azar para asistir a clases
tratamiento (quién recibe y quién no reducidas o a c l a s e s d e t a m a ñ o
recibe el tratamiento) es aleatoria; la n o r m a l ; como resultado, los alumnos que
aleatorización de la asignación al asistieron a clases reducidas deberían
tratamiento garantiza que los grupos de tener características previas al tratamiento
tratamiento y de control sean, por término similares a las de los alumnos que
medio, idénticos entre sí en todas las asistieron a clases de tamaño normal; por
características observadas y no ejemplo, la edad media de los alumnos de
observadas previas al tratamiento. ambos grupos debería ser comparable.
grupo de
grupo de individuos que recibieron el en el Proyecto STAR, los alumnos que
tratamiento; observaciones para las que X/-- asistían a una clase pequeña estaban en
tratamiento 1 el grupo de tratamiento
grupo de individuos que no recibieron el en el Proyecto STAR, los alumnos que
grupo de tratamiento; observaciones para las que asistían a una clase de tamaño normal
X,=0 formaban parte del grupo de control
control
características de los individuos de un En el Proyecto S T A R , antes de asignar a
estudio antes de que se administre el los alumnos a clases reducidas o de
tratamiento. tamaño normal, los investigadores
características características no pueden verse afectadas registraron los datos demográficos de los
del por el tratamiento estudiantes, como la edad, el sexo y la
pretratamiento raza/etnia.
el estimador de la diferencia de medias se
define como el resultado medio del grupo en el conjunto de datos STAR, el
de tratamiento menos el resultado medio estimador de la diferencia de medias
del grupo de control: para las puntuaciones de las pruebas
estimador de de lectura es de 632,7 puntos
diferencia de medias grupo de 625,49 puntos = 7,21 puntos
tratamientogrupo de control
Dado que el Proyecto STAR fue un
cuando los grupos de tratamiento y de experimento aleatorio, la diferencia de
control son similares c o n respecto a medias es un estimador válido del efecto
todas l a s variables que podrían afectar causal medio de asistir a una clase
al resultado distintas de la propia variable pequeña sobre el rendimiento de los
de tratamiento, produce una estimación alumnos; concluimos que asistir a una
válida del efecto causal medio de X sobre clase pequeña, frente a una de tamaño
V; en este caso, estima el cambio medio normal, aumentó los resultados de los
en V causado por un cambio en X alumnos en las pruebas de lectura en 7,21
puntos de media.
interpretar como:
— un aumento medio de V si es positivo
— una disminución media de V si es
negativa
— no hay cambio medio en V si es cero

unidad de medida de este estimador:


si V no es binarioq: en la misma unidad
de medida que V
si V es binario: en puntos
porcentuales (tras multiplicar el
resultado por 100)

unidad de medida de la diferencia


punto porcentual aritmética entre dos porcentajes en el conjunto de datos STAR, el
estimador de la diferencia de medias para
graduados es 87,35'â - 86,65°6 = 0,7
p.p.; se calcula q u e asistir a una clase
pequeña aumenta la proporción de
estudiantes que terminan el bachillerato
en aproximadamente 1 punto porcentual,
de media
EXPERIMENTOS 57
ALEATORIOS

resultado medio del resultado medio observado para las personas en el conjunto de datos STAR, la
grupo de tratamiento que recibieron el tratamiento (después del puntuación media en lectura de los alumnos
(grupo de tratamiento)
tratamiento) que asistieron a una clase pequeña fue de
unos 632,7 puntos
resultado medio del resultado medio observado para las personas
grupo de control que no recibieron el tratamiento (después de en el conjunto de datos STAR, la puntuación
( grupo de control)
ningún tratamiento) media en lectura de los alumnos que asistieron a
una clase de tamaño normal fue de unos 625,49
datos experimentales datos de un experimento aleatorio puntos
Dado que el Proyecto STAR era un
experimento aleatorio, los datos que
datos datos recogidos sobre sucesos que ocurren de analizamos en este capítulo son datos
observacionales forma natural, en los que se recibe o no experimentales.
tratamiento sin intervención de los
investigadores datos sobre el tamaño de las clases y el
rendimiento de los alumnos procedentes de
distritos en los que el tamaño de las clases
varía como consecuencia de factores como
tipo de estudio que analiza
los presupuestos escolares, la matriculación
estudio datos de alumnos o las limitaciones físicas de los
observacional edificios escolares
(véase la entrada anterior)

i i' 1 I i u i i'i 1 u p t' i'i "w i ii v-.'i* 1'i I t---1 ', s 1ie 11i-'i tl'a' c'1is i i s ii1i u rsi ¡ U ! ii
• d I . i 1I\f- "J I* i I{ia iI'. "i "i {I i11.1 i I i il i i s i11cif c "I1 IIi > x1I "IIz lf 1.1 I- i I
ieioti's i1 -m 1.1ii .1 .s i1fi".n iii' s'i'> tl rii iinl'i'r a i'.'w i
i li9J i tt t I t'i tsi t-d tj d t-- i- i 1ij ii- i t' {t- fi i I ii j i ii9 i ii t' ts iI ij 1JJ t'r 1. s i ii li 9io
una variable dentro de un marco de datos, ya sea para acceder a ella o para c r e a r l a ; # identifica la
variable
a su izquierda, especificamos el nombre del objeto donde se variable de nombre "rnstde el marco
almacena el dataframe (sin comillas); a su d e r e c h a , de datos almacenado en el objeto de
especificamos el nombre del elemento o variable (sin comillas) nombre datos
operador utilizado para extraer una selección de observaciones de
una variable; a su i z q u i e r d a , especificamos la variable que # extrae las observaciones de la
queremos subconjuntar; dentro de los c o r c h e t e s , especificamos variable vor/ para las que la
los criterios de selección; por ejemplo, podemos especificar una variable trabajo es igual a 1
prueba lógica utilizando el operador relacional sólo se
extraerán las observaciones para las que la prueba lógica sea
verdadera

' rr.i frs I lir i nnci'c-5 n* .i II-ii r-r, 5i'yi.'r.i Ir il lir| ' I+ ciM.1s,
nueva variable basada en los en el siguiente orden: prueba 4 devuelve un 1 siempre que la
valores de una existente lógica (ver ) observación de la variable eq uals
valor de retorno si la prueba "qes" y un 0 en caso contrario,
es verdadera creando el contenido de una va riable
(3) valor de retorno si la prueba benar q mediante el cIJa racter exist
es falsa los valores deben estar trJq
entre comillas si es texto pero sin va rim h Ie vnri nh Ie
comillas si es

También podría gustarte