Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sintaxis
b) Con un 95% de confianza, indique si el promedio de las jubilaciones para las personas que
han cotizado entre 30 y 35 años difiere significativamente de $250.000 (planteado en
moneda de 2018). En casos de haber una diferencia significativa, indique entre qué valores
está dicha media a nivel poblacional.
Sintaxis
EXAMINE VARIABLES=Deflactor_IPC_2018
/PLOT BOXPLOT NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Observando la asimetría Skewness, se tiene que para ambos grupos este estadístico está entre -1 y
1, por lo que no hay colas largas y es posible continuar con la prueba t para muestras
independientes
Sintaxis
T-TEST
/TESTVAL=250000
/MISSING=ANALYSIS
/VARIABLES=Deflactor_IPC_2018
/CRITERIA=CI(.95).
El intervalo de confianza, al tener valores negativos, indica que la media del valor de jubilación es
menor a 250000, por lo que la jubilación se encuentra por debajo de valor calculado por el experto
para el 2018.
Para saber entre qué valores está este valor, habrá que despejar el intervalo:
-26.879,7854 < µ -250.000 < -5.478,9183
-26.879,784 + 250.000 < µ - 250.000 + 250.000 < -5.478,9183 + 250.000
223.120,2146 < µ < 244.521,0817
2) Desde comienzo de este año 2020, la mayor preocupación a nivel mundial ha sido la
propagación del Covid-19 y las medidas que se deben tomar para controlar su propagación.
Con el fin de generar medidas para controlar los contagios, diversos expertos e investigadores
han estudiado distintos factores que podrían explicar esto.
Teniendo en cuenta que existe una gran dispersión entre la población de cada comuna del
país, en esta ocasión se busca estudiar la Tasa de Contagio Comunal, la cual es calculada como
la cantidad de casos confirmados hasta el 7 de agosto, respecto a la población total de la
comuna (cantidad de casos confirmados a la fecha en la comuna divididos en la población de
ésta).
Considerando que según cifras oficiales del MINSAL, al 12 de agosto un 69,7% de los casos
confirmados corresponden a la Región Metropolitana, utilice únicamente dicha Región para el
cálculo de lo siguiente:
Sintaxis:
USE ALL.
COMPUTE filter_$=(Cod_region = 13).
VARIABLE LABELS filter_$ 'Cod_region = 13 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
a) Genere una matriz de correlaciones bivariada con las variables que usted considere
necesarias para explicar la Tasa de Contagio Comunal. Analice los resultados y determine
qué variable sería la mejor candidata para explicar esta Tasa.
Sintaxis:
CORRELATIONS
/VARIABLES=tasa_cont Poblacion per_riesgo_com hogares_hacinados TasaPobreza
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
Solo se tiene una significancia de 0 < 0.05 en las variables Hogares hacinados presentes en el
Registro Social de Hogares según tramos de Clasificación Socioeconómica (CSE) y Tasa de pobreza
multidimensional por comuna, siendo la variable de hogares hacinados la que presenta una mayor
correlación (0.424), siendo esta la elegida para seguir trabajando.
b) Genere un gráfico de dispersión simple entre la Tasa de Contagio Comunal y la variable
que haya elegido en el punto anterior. Añada línea de tendencia e interprete el R2.
Sintaxis
GRAPH
/SCATTERPLOT(BIVAR)=hogares_hacinados WITH tasa_cont BY Comuna (IDENTIFY)
/MISSING=LISTWISE.
No se realiza filtro, ya que si bien se visualizan casos outlier son varios y en distintas partes del eje
que no fácilmente detectable cual quitar.
El coeficiente de determinación de bondad de ajuste del modelo lineal (R2) es 0.18, que indica que
el 18% de la variabilidad en la tasa de contagio comunal está siendo explicada por los Hogares
hacinados presentes en el Registro Social de Hogares según tramo de Calificación Socioeconómico
(CSE)
c) Ajuste un modelo de regresión lineal simple explicando la Tasa de Contagio Comunal,
considerando la variable ya escogida. Interprete el coeficiente R y el coeficiente de
determinación.
Sintaxis
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT tasa_cont
/METHOD=ENTER hogares_hacinados
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/RESIDUALS NORMPROB(ZRESID)
/SAVE PRED ZPRED RESID ZRESID.
R toma el valor de 0.424 indica que existe una relación lineal moderada-débil entre la tasa de
contagios comunal y la variable Hogares hacinados presentes en el Registro Social de Hogares
según tramo de Calificación Socioeconómico (CSE).
R2 con el valor 0.18 indica que un 18% de la variabilidad en la tasa de contagios comunal está
siendo explicada por Hogares hacinados presentes en el Registro Social de Hogares según tramo
de Calificación Socioeconómico (CSE)
d) Evalúe la significancia de los coeficientes. Argumente correctamente.
Significancia de coeficientes:
H0: El coeficiente i no es significativo.
H1: El coeficiente i es significativo.
Donde i = {0, 1}
El intercepto posee una significancia del 0.004 y el coeficiente asociado a hogares hacinados posee
una significancia del 0.002, que ambas son menores al 0.05 por ende se posee evidencia
estadística para rechazar la hipótesis nula, por lo tanto, ambos coeficientes son estadísticamente
significativo
Ecuación:
Y = 0.016 + 0.001 ∙ X
Donde Y = Puntaje Tasa de contagio comunal y X = Puntaje de Hogares Hacinados
Se puede explicar que, ante el aumento de puntaje en la tasa de contagios comunal, en promedio
el puntaje de hogares hacinados aumenta en 0.001 puntos.
f) Verifique los supuestos de normalidad de los residuos y homocedasticidad.
Visualizando el gráfico PP, los puntos no están todos pegados a la línea de 45 grados por ende se
puede indicar el no cumplimiento del supuesto de normalidad de los residuos, pero esto se
verificará con una prueba de normalidad de los residuos estandarizados.
Sintaxis
EXAMINE VARIABLES=ZRE_1
/PLOT BOXPLOT STEMLEAF NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Observando la prueba de K-S se observa que no se rechaza la hipótesis de normalidad de los
residuos ya que la significancia es mayor al 0.05. Por ende, se puede hacer inferencia en la
población.
g) Evalúe si al agregar la variable dummy “Zona” como otra variable independiente, resulta
significativa para el modelo. Justifique claramente.
Sintaxis
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT tasa_cont
/METHOD=ENTER hogares_hacinados Zona
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/RESIDUALS NORMPROB(ZRESID)
/SAVE PRED ZPRED RESID ZRESID.
Se observa una mejora en el modelo, ya que ahora R 2 obtiene un valor de 0.203 lo que indica que
la tasa de contagio comunal está siendo explicada por el 20.3% por los hogares hacinados y la
variable que indica que tipo de zona es, si es rural o urbana.
H0: El coeficiente asociado a la variable dummy que indica si la zona es urbana o rural, no es
significativa.
H1: El coeficiente asociado a la variable dummy que indica si la zona es urbana o rural, es
significativa.
Al tener una significancia de 0 < 0.05 indica que hay evidencia para rechazar la hipótesis nula, por
ende se acepta que la variable dummy es significativa en el modelo