Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Uno de los principales objetivos del análisis de datos en las clases de tamaño normal, de 22 a
ciencias sociales es la estimación de los efectos causales, 25 alumnos, hasta el final del tercer
también conocida como inferencia causal. ¿Qué son los efectos curso. Los investigadores siguieron
causales? ¿Y cuál es la mejor forma de estimarlos? Éstas son el progreso de los alumnos a lo
las principales preguntas a las que responderemos en este largo del tiempo. Como variables de
capítulo. Para ilustrar los conceptos tratados, analizamos los resultado de interés, tenemos las
datos de un experimento del mundo real. En concreto, puntuaciones de los alumnos en los
estimamos el efecto causal de las clases pequeñas en el exámenes estandarizados de
rendimiento de los alumnos utilizando datos del Proyecto STAR. lectura y matemáticas de tercer
grado, así como las tasas de
graduación en la escuela
secundaria.
En este libro, en aras de la simplicidad, nos centramos en las RECUERDE: Una variable btnarq toma
variables de tratamiento que son binarias, es decir, que indican si sólo dos valores, en este libro 1 s y 0s, y
el tratamiento e s t á presente o ausente. Definimos la variable de la notación i identifica el posttton de la
observación tn un dataframe o tn una
tratamiento para cada individuo i como: variable.
El problema fundamental al que nos enfrentamos a la hora de Sólo observamos lo que ocurre en la
inferir efectos causales es que nunca observamos al mismo realidad (el resultado factual). Nunca
individuo recibiendo el tratamiento y sin recibirlo a l mismo podemos observar lo que habría
ocurrido si hubiéramos tomado
tiempo. decisiones diferentes (el resultado
contrahecho).
I" I . xa. v1I" 1. i f'u'Jn I I" 1 'ml- r 1.. s. I I I" I" III x(" 1-
111 II'I-. 51Ir \ ' ' .I Iz 5.1l I-lfI'' 15. \\ I- I1I-I'J\ I I' 1 I'II .|'.1r'' 17IJ' !.II It I.Il JLII' IDIII
I' As I I I -tI'' I L/IJI I1''r I I' I IJrll 'IUI I I IIII-, VIII I \\ L- E I I I IL'VL-I U1131' ¥f- 1tI1' I
LJIJI I1''r Ic" I IJnil EILIII 011\1'
Para sortear el problema fundamental de la inferencia causal, RECUERDE: La media de una variable es
igual a la suma de los valores de todas las
debemos encontrar buenas aproximaciones para los resultados
observaciones dividida por el número de
contrafactuales. Para lograrlo, nos alejamos de los efectos a observaciones. A menudo se representa
nivel individual y nos centramos en el efecto causal medio en un con el nombre de la variable y una barra en
grupo de individuos. la parte superior.
Cara Cruz
I -/1t' -/ /1"" /1 I'\14.1n t/. Fig LU iri'j i .i5i'l i#iii £rfl'¥i I iii i' i^l
-r55ri |i M M''i i i1 ".\ t' i rlri riwiJiili" I l1a- \ I is' \ r i I ii ii "i if isiHI E 'i-i I i ul III
CILI§ t'> W4'f 1 1 IDII '|3rgI <Igf!4' tI4'*UI 4' 18I4' <I4 III III i5 I I c11 IEIf I €I# r IL
I i ''-1Jzii''. i I . 45 " s i-5ril1, \¥ r- ' <i it r I' fly cut I l1\- s! i1l''r r i i i- i it
¡iii1'-i i: > 1'xEi ii dejar Ui 1¢i | 3 r 'i'. irl'' a x en él! I'm I i iii+i I r ¢i^ I l1i- <i-.'' : aijr-
Ire.\1'iicn i rlfr'r.
Para seguir el análisis de este capítulo, puede crear un nuevo CONSEJO: Si estás comenzando una
script de R en RStudio y practicar el código usted mismo. nueva sesión de R, para operar con los
También puede abrir "Experimental.R" en RStudio, que contiene datos, necesitas volver a ejecutar parte
del código que escribimos en el capítulo
todo el código de este capítulo. Comenzamos el análisis anterior, espectficallg los ltnes de código
ejecutando el siguiente código del capítulo anterior: que:
## t1] TRUE
EXPERIMENTOS 41
ALEATORIOS
##/1]FALSE
RECUERDE: En el conjunto de datos Podemos aplicar operadores relacionales a todos los valores de
STAR, la variable closstqpe tdenttfies la una variable a la vez. En este caso, R considera el valor de cada
clase a la que asistió el alumno. En R, observación uno a uno y devuelve un VERDADERO o un FALSO
utilizamos el carácter para acceder a una
variable dentro de un marco de datos. A la
para cada uno de ellos. Por ejemplo, si quisiéramos determinar
izquierda, vemos el nombre del objeto qué alumnos del conjunto de datos STAR asistieron a una clase
donde se almacena el marco de datos (sin pequeña, ejecutaríamos
comillas). A la derecha, vemos el nombre
de la variable (sin comillas). Ejemplo: Se
## t1] TRUE FALSE FALSE TRUE TRUE FALSE ##
utilizan comillas para los valores de texto,
pero no para los valores numéricos. En la t7] TRUE TRUE FALSE FALSE FALSE
salida, los números entre paréntesis al
principio de cada línea indican la posición
de la observación correspondiente a la Después de ejecutar el código anterior, R devuelve tantos valores
derecha. lógicos como observaciones en la variable classtype. (Aquí
mostramos gou sólo los primeros 1 2.) Para los estudiantes que
asistieron a una clase pequeña, R devuelve TRUE porque el valor
de classtgpe es igual a "small". Para los estudiantes que no
asistieron, R devuelve FALSE. Por ejemplo, como vimos en la
salidade más arriba, el valor declasstgpe para la
primera observación es "pequeño", y por lo tanto, aquí R devuelve
TRUE como primera salida.
L:- i'j <q i'\r - l'i \r L''1 , r ' ari c' -traer la selección de observa-
ciones para las que una prueba lógica es verdadera. Esto
resulta útil en diversas situaciones. Por ejemplo, para estimar el
efecto causal medio de los pequeños sobre la lectura,
necesitamos calcular el siguiente estimador de diferencia de
medias:
Valores de pequeño y lectura para las Para el cálculo de la media se seleccionan todas las
primeras stx observaciones en el observaciones de lectura para las que la prueba lógica
conjunto de datos STAR. Las especificada entre corchetes es verdadera. Por ejemplo, entre
observaciones de los alumnos que
asistieron a una clase pequeña (smo//-1) las seis primeras observaciones del conjunto de datos, onfg los
aparecen en negro, y las observaciones valores de lectura que corresponden a las observaciones 1, 4 y
de los alumnos que asistieron a una 5 se incluyen en esta media. (Véase la tabla al margen.) Según
clase normal (smo//=0) aparecen en gris. el resultado anterior, los alumnos que asistieron a una clase
pequeña obtuvieron una media de 633 puntos en la prueba de
i lectura lectura.
peque
ño ¿Qué ocurre con los alumnos que asistieron a una clase de
1 1 578 tamaño normal? El código para calcular esta media es idéntico
2 0 612 al anterior, salvo que ahora el criterio de inclusión es que
3 0 583 pequeño debe ser igual a 0.
4 1 661
5 1 614 4 para el grupo de control
6 0 610
EXPERIMENTOS 47
ALEATORIOS
## t1] 625.492
## t1] 5.989905
44 calcular el estimador de diferencia de medias para graduados CONSEJO: Las buenas conclusiones son
claras, concisas e incluyen los
elementos clave del análisis. Por
ejemplo, cuando se calculen los efectos
## t1] 0.007031124 causales medios con experimentos en
serie, asegúrese de transmitir:
Estos dos trozos de código son idénticos al anterior, salvo que el supuesto: los grupos de tratamiento
y de control son comparables en
ahora utilizamos matemáticas y graduado, respectivamente, en
función de las características
lugar de lectura como variable de resultado de interés. previas al tratamiento; en este caso,
los alumnos que asistían a clases
¿Qué podemos concluir de estos resultados? Suponiendo que reducidas eran comparables antes de
los alumnos que asistían a clases reducidas fueran comparables la escolarización a los que asistían a
antes de la escolarización a los que asistían a clases de tamaño clases regulares.
normal (una suposición razonable dado que el conjunto de datos la justificación de la hipótesis: el
conjunto de datos procede de un
procede de un experimento aleatorio), estimamos que asistir a experimento aleatorizado
clases reducidas: el tratamiento: asistir a una clase
pequeña la(s) variable(s) de
aumentó el rendimiento de los alumnos en la prueba de lectura resultado
de tercer curso en 7 puntos de media puntuacion
el rendimiento de los alumnos en el examen de matemáticas de es en las pruebas de lectura de tercer
curso, puntuaciones en las pruebas de
tercer curso aumentó 6 puntos de media matemáticas de tercer curso y
- aumentaron la proporción de estudiantes que terminan el proporción de alumnos que se
b a c h i l l e r a t o en aproximadamente 1 punto porcentual, gradúan en un centro de enseñanza
por término medio. superior
la densidad, el tamaño y la unidad de
medida del efecto o efectos causales: un
Tenga en cuenta que las conclusiones deben mencionar los aumento de 7 puntos porcentuales, un
aumento de 6 puntos porcentuales y un
elementos clave del análisis. (Además, tenga en cuenta que la aumento inferior a un punto
unidad de medida de la estimación de la diferencia de medias porcentual, respectivamente.
difiere según el tipo de variable de resultado. Véase el resumen el hecho de que está haciendo una
proporcionado en el esquema 2.1. (Al igual que hicimos al afirmación causal: utilice un lenguaje
discutir la interpretación de las medias en el capítulo 1, causal (asistir a una clase pequeña
aumenta el rendimiento de los
excluimos las variables categóricas de esta discusión). alumnos) en lugar de un lenguaje
observacional (los alumnos que asisten
a una clase pequeña rinden más que
los que asisten a una clase normal).
el hecho de que usted esté estimando
EXPERIMENTOS 49
ALEATORIOS
ESQUEMA 2.1. Untt de medida del estimador \i fl i1 Al lli P 1 Hi €''il6rl I De Ella' £l ifiCi I'll\-- i ii - li' Sri i\l I'lliiil'1 lote
de la diferencia-tn-medias basado en el tqpe
de la variable de resultado.
## t1] 0.0070312
Como ya sabíamos por nuestros cálculos anteriores, el estimador que nos hayamos familiarizado con
de diferencia de medias para graduado es igual a 0,007. Debe los conceptos pertinentes.
interpretarse como un aumento de la probabilidad de graduarse
en el instituto de 0,7 puntos porcentuales de media (0,007 x 100
0 ,7 p.p. u 87,35°é-86,65°é 0,7 p.p.).
relación causal se refiere a la conexión de causa y efecto en este capítulo, exploramos la relación
entre dos variables en la que un cambio en causal entre asistir a una clase pequeña y el
una variable sgstematicallg produce un rendimiento de los alumnos:
cambio en la otra; representamos una
relación causal con una flecha entre las pequeño -+ rendimiento
variables:
La pregunta a la que pretendemos responder
es si asistir a una clase pequeña aumenta,
disminuye o tiene un efecto nulo sobre el
rendimiento medio de los alumnos.
variable de variable cuyo cambio maq producir en el proyecto STAR, la variable de tratamiento
tratamiento es
\x) cambio en la variable de resultado; pequeño, que definimos como:
variable donde se origina el cambio; en
este libro, la variable de tratamiento es 1si el estudiante i asistió
siempre binarq:
smalli - una clase pequeña
1si el individuo i
recibe el tratamiento 0 si el alumno i asistió
Xi = a una clase de
0 si el individuo i no tamaño normal
recibe el tratamiento
las variables de tratamiento son un tgpe
de la variable independiente
variable de resultado variable que puede cambiar como resultado en estas relaciones causales:
\ Y) de un cambio en la variable de tratamiento;
las variables de resultado son lo mismo que pequeño -+ lectura
las variables dependientes pequeño -+
matemáticas pequeño
-+ graduado
pequeño es la variable de tratamiento, y
lectura, matemáticas y graduado son l a s
variables de resultado
condición de la condición cuando el tratamiento está
tratamiento presente; condición cuando X/--1 en el Proyecto STAR, los alumnos que
asistían a una clase pequeña estaban bajo la
condición de tratamiento
la condición cuando el tratamiento está
condición de control ausente; condición cuando X/--0 en el Proyecto STAR, los alumnos que asistían a
una clase de tamaño normal estaban bajo la
condición de control
uno de los dos resultados potenciales para el
resultado potencial individuo i ; resultado potencial para el en el Proyecto STAR, el resultado potencial
bajo la condición de individuo i cuando el tratamiento está presente; bajo la condición de tratamiento es el
tratamiento el valor de V/ si X/--1 rendimiento del alumno después de asistir a
(Vi(X --1)) una clase pequeña desde el jardín de
uno de los dos resultados potenciales para el infancia hasta el tercer grado
resultado individuo i; resultado potencial para el
potencial en la individuo i cuando el tratamiento está ausente; en el Proyecto STAR, el resultado potencial
condición de el valor de V/ si X/--0 bajo la condición de control es el rendimiento
control del alumno después de asistir a una clase de
(V;(X;-0)) Letra griega Delta; notación matemática tamaño normal desde el jardín de infancia
del cambio hasta el tercer grado
& V/ representa el cambio en V para el
individuo i
EXPERIMENTOS 55
ALEATORIOS
resultado medio del resultado medio observado para las personas en el conjunto de datos STAR, la
grupo de tratamiento que recibieron el tratamiento (después del puntuación media en lectura de los alumnos
(grupo de tratamiento)
tratamiento) que asistieron a una clase pequeña fue de
unos 632,7 puntos
resultado medio del resultado medio observado para las personas
grupo de control que no recibieron el tratamiento (después de en el conjunto de datos STAR, la puntuación
( grupo de control)
ningún tratamiento) media en lectura de los alumnos que asistieron a
una clase de tamaño normal fue de unos 625,49
datos experimentales datos de un experimento aleatorio puntos
Dado que el Proyecto STAR era un
experimento aleatorio, los datos que
datos datos recogidos sobre sucesos que ocurren de analizamos en este capítulo son datos
observacionales forma natural, en los que se recibe o no experimentales.
tratamiento sin intervención de los
investigadores datos sobre el tamaño de las clases y el
rendimiento de los alumnos procedentes de
distritos en los que el tamaño de las clases
varía como consecuencia de factores como
tipo de estudio que analiza
los presupuestos escolares, la matriculación
estudio datos de alumnos o las limitaciones físicas de los
observacional edificios escolares
(véase la entrada anterior)
i i' 1 I i u i i'i 1 u p t' i'i "w i ii v-.'i* 1'i I t---1 ', s 1ie 11i-'i tl'a' c'1is i i s ii1i u rsi ¡ U ! ii
• d I . i 1I\f- "J I* i I{ia iI'. "i "i {I i11.1 i I i il i i s i11cif c "I1 IIi > x1I "IIz lf 1.1 I- i I
ieioti's i1 -m 1.1ii .1 .s i1fi".n iii' s'i'> tl rii iinl'i'r a i'.'w i
i li9J i tt t I t'i tsi t-d tj d t-- i- i 1ij ii- i t' {t- fi i I ii j i ii9 i ii t' ts iI ij 1JJ t'r 1. s i ii li 9io
una variable dentro de un marco de datos, ya sea para acceder a ella o para c r e a r l a ; # identifica la
variable
a su izquierda, especificamos el nombre del objeto donde se variable de nombre "rnstde el marco
almacena el dataframe (sin comillas); a su d e r e c h a , de datos almacenado en el objeto de
especificamos el nombre del elemento o variable (sin comillas) nombre datos
operador utilizado para extraer una selección de observaciones de
una variable; a su i z q u i e r d a , especificamos la variable que # extrae las observaciones de la
queremos subconjuntar; dentro de los c o r c h e t e s , especificamos variable vor/ para las que la
los criterios de selección; por ejemplo, podemos especificar una variable trabajo es igual a 1
prueba lógica utilizando el operador relacional sólo se
extraerán las observaciones para las que la prueba lógica sea
verdadera
' rr.i frs I lir i nnci'c-5 n* .i II-ii r-r, 5i'yi.'r.i Ir il lir| ' I+ ciM.1s,
nueva variable basada en los en el siguiente orden: prueba 4 devuelve un 1 siempre que la
valores de una existente lógica (ver ) observación de la variable eq uals
valor de retorno si la prueba "qes" y un 0 en caso contrario,
es verdadera creando el contenido de una va riable
(3) valor de retorno si la prueba benar q mediante el cIJa racter exist
es falsa los valores deben estar trJq
entre comillas si es texto pero sin va rim h Ie vnri nh Ie
comillas si es