Está en la página 1de 2

Laboratorio N°1: Linear Regressions

Valentina Moraga Villarroel

Parte 1
Se busca analizar la relación entre los Indicadores de Desarrollo Personal y Social (IDPS) y
el puntaje SIMCE de los establecimientos educacionales a nivel nacional.

I) Para esto se trabajó con una base de datos de los 7.558 colegios en Chile, la cual presenta los
cuatro IDPS (autoestima escolar, convivencia, formación ciudadana y hábitos saludables),
los puntajes SIMCE (matemática, lenguaje) y otras características de los establecimientos.
Se incorpora a la base una variable, el promedio de las dos pruebas del SIMCE.
II) Se realizaron 4 regresiones, una para cada IDPS como variable dependiente, y el promedio
SIMCE como variable explicativa obteniendo los siguientes resultados:
Tabla de regresiones N°1
Dependent variable:

idps_autoestimaescolar idps_convivencia idps_formacionciudadana idps_habitossaludables


(1) (2) (3) (4)

promedio_simce 0.040*** 0.108*** 0.070*** 0.071***


(0.002) (0.003) (0.003) (0.003)

Constant 64.045*** 48.237*** 60.193*** 52.768***


(0.576) (0.710) (0.790) (0.738)

Observations 6,593 6,593 6,593 6,593

R2 0.045 0.184 0.072 0.083


Adjusted R2 0.044 0.184 0.072 0.083
Residual Std. Error (df =
4.978 6.134 6.831 6.382
6591)
F Statistic (df = 1; 6591) 307.095*** 1,490.638*** 509.565*** 596.758***
* ** ***
Note: p p p<0.01
III) Podemos notar que del modelo (2) se tiene una relación de aumento entorno a un 0.108 en la
unidad del IDPS convivencia por cada punto de rendimiento en el SIMCE, manteniendo
todos los factores y heterogeneidades propias de los establecimientos escolares que no se
consideran en el modelo. Este resultado es significativo al 5%. Además, es el modelo con
mayor R2=0,184, lo que refleja una mayor bondad del ajuste de este modelo a la variable
IDPS convivencia.
En cambio, al considerar el IDPS tanto de formación ciudadana como de hábitos saludables,
la relación de interés disminuye a 0,07; es más, para el caso del IDPS de autoestima escolar,
la relación continúa disminuyendo a 0,04.
Suponiendo que los supuestos sobre los errores poblacionales se cumplen y, de acuerdo con
los resultados, podemos aceptar que existe una relación positiva entre cada IDPS y el
rendimiento en el SIMCE (promedio de pruebas de matemáticas y lenguaje).
IV) Se escogió el IDPS de convivencia escolar, para realizar regresiones sucesivas agregando
variables de control (dependencia, ruralidad, matrícula). Se obtuvo la siguiente tabla que
resume los resultados:
Tabla de regresiones N°2
Dependent variable:
idps_convivencia
(1) (2) (3)
*** ***
dependencia 2.460 3.764 3.805***
(0.135) (0.140) (0.142)
rural 4.391*** 4.236***
(0.177) (0.199)
matricula -0.0004*
(0.0002)
Constant 71.684*** 68.153*** 68.297***
(0.225) (0.258) (0.272)

Observations 6,593 6,593 6,593


2
R 0.048 0.129 0.129
Adjusted R2 0.048 0.128 0.129
Residual Std. Error 6.629 (df = 6591) 6.341 (df = 6590) 6.340 (df = 6589)
F Statistic 330.128 (df = 1; 6591) 486.506 (df = 2; 6590) 325.393*** (df = 3; 6589)
*** ***

* ** ***
Note: p p p<0.01
Podemos observar que del modelo (2) y (3) se tiene una relación de aumento entorno a un
3.8 aproximadamente en la unidad del IDPS de convivencia según dependencia del
establecimiento (particular, subvencionado o municipal), y además para el modelo (1), la
relación disminuye a 2.5 aprox. Este resultado a una significancia de 5%.
Al controlar por el factor rural la relación de interés aumenta a 4.4 para el modelo (2) y 4.2
para el modelo (3) puntos el IDPS de convivencia. Sin embargo, al controlar por el factor de
matrícula, no se presenta algún cambio en el modelo (3). Es más el R2 es el mismo (0,129),
siendo este el más alto entre los modelos, reflejando que es mayor el ajusto del modelo (2) y
(3) en comparación del (1) para explicar el IDPS convivencia. Por lo que no hay variación
entre el modelo (2) y (3) a pesar de incorporar la variable matricula.

Parte 2
Se realizó un loop que iteró 500 veces, dentro de este se creó una variable aleatoria que
distribuye normal de media 12 y varianza 4. De esta manera, se realizó una regresión del
IDPS convivencia escolar sobre esta nueva variable normal (12,4), de manera de observar si
esta variable explicativa es significativa en la regresión hecha, es decir presenta un
p-value<0,05.

Al finalizar el loop se obtuvo que 24 de los 500 resultados obtenidos eran significativos, esto
indica que, si se busca explicar el IDPS de convivencia escolar mediante los números que
arroja la variable aleatoria, un 4,8% de las 500 veces que se realiza el modelo se obtendrán
resultados estadísticamente significativos a un 5%.

También podría gustarte