Está en la página 1de 6

Estimados estudiantes, esta Tarea del 2er bimestre cubre material desarrollado en lo que

va de esta segunda parte del módulo. Es necesario que hayan leído la guía y
desarrollado los ejemplos de los capítulos 3-7.

Es necesario que realices estas preguntas usando RStudio o R, ya que el código


solicitado, los gráficos y las respuestas requieren el uso de la esa aplicación.

La actividad dará hasta 6 puntos al promedio final. Por favor, responder puntualmente a
las preguntas planteadas. Se calificará la respuesta correcta con los puntos que se
muestran en color ROJO, en cada pregunta. La fecha límite para enviar la tarea es el 14
de julio a las 23h55. Éxitos!

La base de datos ha sido tomada del material de Lauren Hanlon, compartido por Angrist y Lavy,
el cual ha sido publicado en la siguiente página web
https://github.com/laurenhanlon/Maimonides-Rule-and-Class-Sizes

La base de datos explora la relación entre el tamaño de la clase y el rendimiento en


matemáticas y lectura, en escuelas de Israel. Joshua D. Angrist y Victor Lavy publicaron los
resultados en un artículo científico llamado Using Maimonides' Rule to Estimate the Effect of
Class Size on Student Achievement. Si lo desean pueden leero descargando el artículo en el
siguiene link https://economics.mit.edu/files/8273

La idea principal consiste en una política en Israel de limitar las clases a un máximo de 40
alumnos por aula. En este sentido al tener una escuela 40 alumnos, estos pueden permanecer
en un aula. Sin embargo, si la escuela tiene 41 alumnos, esta se tiene que dividir en un aula de
20 y otra de 21. Lo mismo pasaría si una escuela tuviera 80 alumnos, divididos en 2 aulas de
40. Pero al tener 81 alumnos tendrán que dividirse en 3 aulas de 27. Esta regla usada para
dividir aulas se llama Maimonides en honor al rabino que la creo. Para generar esta regla, se
usa la siguiente función:

enrollment
maimonides=
enrollment−1
floor ( 40
+1 )
Donde, maimonides sería el tamaño hipotérico del aula que aconseja Maimonides. Enrollment
(matriculados en inglés) es el número de estudiantes matriculados en un grado. Floor es el
entero redondeado más bajo, por ejemplo floor(9.9)=9.

Por ejemplo, si tenemos 81 o 80 alumnos:

81 81 81
maimonides= = = =27
80 floor ( 2 ) +1 3
floor ( )
40
+1

80 80 80 80
maimonides= = = = =40
79 floor ( 1.9 )+1 1+1 2
floor ( )
40
+1

La idea de esta actividad será medir el impacto del tamaño del aula, en el rendimiento de
estudiantes de 5to año, usando la base de datos que usó Angrist y Lavy. La base de datos
contiene variables de estudiantes de 5to año de escuelas de Israel, cada observación es un
aula:

Classize: tamaño del aula, en otras palabras, el número de estudiantes en el aula.

c_size: Enrollment en inglés, sería el número de estudiantes matriculados en 5to en la escuela.

tip_a: Porcentaje de estudiantes pobres en el aula

avgverb: Reading en inglés, promedio de notas en lectura en el aula

avgmath: Math en inlgés, promedio de notas en matemáticas en el aula

Queremos estimar estos modelos

Reading=β o + β 1 Class ¿ β ¿2 Poor + β 3 enrollment+ β 4 enrollmen t 2+ β5 enrollmen t 3+ e

Math=β o + β 1 Class ¿ β ¿2 Poor+ β 3 enrollment+ β 4 enrollmen t 2 + β 5 enrollmen t 3 +e


Para ello vamos a realizar lo siguiente:

 Descarga la base de datos que aparece en el módulo 7, llamada final5_raw_data.dta.


 Importa la base de datos a RStudio.
 Usa los paquetes dplyr, foreign stargazer, dando check en los paquetes o usando los
comandos, library(dplyr), library(foreign) y library(stargazer)
 Utiliza: transmute y mutate para generar una nueva base llamada d, la cual contenga
solo las variables : classize, c_size, tip_a, verbsize, mathsize, avgverb, avgmath,
schlcode. Además, crea en esta nueva base las variables:
o enrollment igual a c_size
o enrollment al cuadrado
o enrillment al cubo
o poor igual a trip_a
o maimonides = enrollment/(floor((enrollment-1)/40)+1)
o T=ifelse(d$classize>=40,1,0)
 Z=ifelse(d$maimonides>=40,1,0)

Observa el ejemplo de la pg 143

 Crea una sub base llamada di. Esta restringe la muestra a escuelas con enrollment
entre 36 y 45, 76 y 85, 116 y 125.
o di <- subset(d, d$c_size>=36 & d$c_size<=45 | d$c_size>=76 & d$c_size<=85
| d$c_size>=116 & d$c_size<=125)
1. Completa la siguiente tabla: (1 pt)

Mean Max Min


Math 27.75 43 3
Reading 27.34 43 3
Class Size 30 47 5
Enrollment 76.94 208 5
Poor 14.11 76 0
Number of clases 2029
Number of schools 1004

Tip: Utiliza nrow(d) para el numero de clases y length(unique(d$schlcode)) para el número de


escuelas. Para el resto usa summary()

2. Elabora un gráfico, con la base de datos d, usando plot(), el cual tenga enrollment en
el eje horizontal y classize en el vertical. (1 pt)
Tip: en la pg 159 usamos plot para graficar 2 variables de una base de datos.

Añade al gráfico creado, el curve() de la función de maimonides:


f=function(x) x/(floor((x-1)/40)+1)
Tip: no olvide de usar add=T al usar curve.
Pega tu gráfico el el siguiente espacio:

3. Analiza el gráfico creado. ¿Por qué la regla de maimonides sería un buen instrumento
para el tamaño del aula? ¿Por qué la regla de maimonides generaría un tipo de
regresión discontinua fuzzy? (1 pt)
En el grafico podemos observar que las matriculas que no son múltiplo de 40, el
tamaño de la clase incrementa linealmente con el tamaño de la matrícula. Pero el
tamaño del aula decae abruptamente en los múltiplos de 40, es decir, en las esquinas
de la función tamaño del aula.

¿Por qué la regla de maimonides sería un buen instrumento para el tamaño del aula?
Desde 1969, esta regla se utiliza para determinar la división del grupo de alumnos
matriculados en las clases de las escuelas públicas israelíes. Esta regla puede utilizarse
como variable exógena en el tamaño de la clase, y puede utilizarse para estimar los
efectos del tamaño de la clase y su incidencia en el logro escolar de los alumnos.

¿Por qué la regla de maimonides generaría un tipo de regresión discontinua fuzzy?


El estudio del tamaño del aula y el uso de variables instrumentales como la regla de
maimonides generan discontinuidades. En este caso, la variable que representa la
regla de maimonides usa discontinuidades no lineales, puesto que dicha variable es
construida con el número de matrículas.
4. Estima el First Stage Regression para Class Size, usando Maimonides como VI. (1 pt)

Class ¿ β o + β 1 Maimonides+ β2 Poor+ β 3 enrollment+ β 4 enrollmen t 2 + β 5 enrollmen t 3 +e

¿Qué opinas del instrumento? (Analiza el nivel de significancia y la pueba F) (Si


consideras necesario pega el resultado de la regresión en tu respuesta)

De acuerdo con los resultados, todas las variables independientes son


estadísticamente significativas de forma individual. Analizando el coeficiente del
maimonides, podemos observar que esta positivamente relacionada con la variable
independiente y que es estadísticamente significativo de forma individual. Lo que
implica que la variable maimonides tiene buenas propiedades como instrumento de la
variable independiente. Observando el r-cuadrado y r-cuadrado ajustado, las variables
independientes representan aproximadamente el 55% de la varianza de la variable
dependiente. Así mismo, la prueba F es significativa. Lo que implica que de forma
conjunta las variables independientes son significativas al momento de explicar la
variable dependiente.

5. Estima los siguientes modelos: (1 pt)

Modelo OLS con muestra d

Reading=β o + β 1 Class ¿ β ¿2 Poor + β 3 enrollment+ β 4 enrollmen t 2+ β5 enrollmen t 3+ e


Math=β o + β 1 Class ¿ β ¿2 Poor+ β 3 enrollment+ β 4 enrollmen t 2 + β 5 enrollmen t 3 +e

Modelo 2SLS con muestra d


Reading=β o + β 1 Class ¿ + β 2 Poor + β 3 enrollment+ β 4 enrollmen t 2 + β 5 enrollmen t 3 +e ¿
Math=β o + β 1 Class ¿ + β 2 Poor+ β3 enrollment + β 4 enrollmen t 2 + β 5 enrollmen t 3 + e ¿

Modelo 2SLS con muestra restringida di


Reading=β o + β 1 Class ¿ + β 2 Poor + β 3 enrollment+ β 4 enrollmen t 2 + β 5 enrollmen t 3 +e ¿
Math=β o + β 1 Class ¿ + β 2 Poor+ β3 enrollment + β 4 enrollmen t 2 + β 5 enrollmen t 3 + e ¿

Donde Maimonides es el instrumento de Class Size.

Tip: Para el modelo 2sls usa el comando ivreg visto en el cap 7 pg 135. Luego, al
estimar los 6 modelos preséntalos en una sola tabla. Recuerda usar el comando
stargazer para mostrar los modelos en una sola tabla, como los hiciéramos en la pg.
164. Prueba agregar al comando stargazer omit.stat=c("f", "ser") para tener una tabla
más compacta.
6. ¿Qué opinas de los resultados? ¿Por qué han cambiado los signos entre los modelos
OLS y los 2SLS? ¿Qué resultado es más confiable? (1 pt)

Los resultados muestran que un buen desempeño en el promedio de lectura y


matemáticas está fuertemente correlacionado con el tamaño del aula. Esta variable es
la única que presenta un coeficiente estadísticamente significativo dentro del grupo de
regresiones. Por otro lado, hay un efecto negativo por parte de la variable pobreza en
el desempeño de lectura y matemáticas en los modelos ols. El número de matrículas
presenta un coeficiente positivo y significativo en los modelos ols, pero esta variable
elevada al cuadrado tiene un efecto negativo. Los modelos OLS tienen mayor r-
cuadrado que los modelos 2SLS. Pero los modelos 2SLS con la muestra di tienen mayor
r-cuadrado, dentro del grupo de modelos.
¿Por qué han cambiado los signos entre los modelos OLS y los 2SLS? ¿Qué resultado
es más confiable?
Esto se debe al sesgo que presenta los estimadores de ols, puesto que la variable
matriculas esta correlacionada con el término de error. Para corregir este problema,
empleamos la metodología 2SLS que utiliza variables instrumentales que están
altamente correlacionadas con la variable matriculas. Por lo tanto los modelos 2SLS
son más confiables que los modelos OLS, ya que corrigen el problema de correlación
entre una variable independiente y e término de error.

También podría gustarte