Está en la página 1de 12

Examen métodos cuantitativos.

Profesora: Sara Arancibia C.


Profesora Auxiliar: Paula Villar S.
Agosto 2020

Raúl Sánchez González.


17.360.463-7
1) La Superintendencia de Pensiones (SP) es el organismo contralor que representa al Estado al
interior del sistema de pensiones chileno. Con el fin de realizar cierto estudio de los datos
históricos de los pensionados, se pone a su disposición una muestra de jubilados que han
cotizado entre 30 y 35 años, tomada en el año 2017 (Muestra_Pensiones_17.sav).
En diciembre del año 2018, un experto informó que el promedio de las pensiones para
jubilados que cotizaron entre 30 y 35 años alcanzaría los $250.000. Considerando la base de
datos que se dispone, en montos del año 2017, se le pide lo siguiente:

IPC diciembre 2017 116.46


IPC diciembre 2018 119.45
Valores con base diciembre 2013=100.

a) Calcule los montos de las pensiones en moneda del año 2018.

Sintaxis

COMPUTE Deflactor_IPC_2018 = Monto_pension * 119.45 / 116.46.


EXECUTE.

b) Con un 95% de confianza, indique si el promedio de las jubilaciones para las personas que
han cotizado entre 30 y 35 años difiere significativamente de $250.000 (planteado en
moneda de 2018). En casos de haber una diferencia significativa, indique entre qué valores
está dicha media a nivel poblacional.

Sintaxis

EXAMINE VARIABLES=Deflactor_IPC_2018
/PLOT BOXPLOT NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.

H0: La jubilación distribuye normal


H1: La jubilación no distribuye normal
Para la jubilación tiene una significancia menor al 0.05, por lo que se tiene evidencia suficiente
para rechazar la hipótesis nula, indicando que el monto de jubilación no distribuye normal.

Observando la asimetría Skewness, se tiene que para ambos grupos este estadístico está entre -1 y
1, por lo que no hay colas largas y es posible continuar con la prueba t para muestras
independientes

Sintaxis

T-TEST
/TESTVAL=250000
/MISSING=ANALYSIS
/VARIABLES=Deflactor_IPC_2018
/CRITERIA=CI(.95).

H0: El valor de jubilación no difiere significativamente de 250000


H1: El valor de jubilación difiere significativamente de 250000
De la prueba se observa una significancia menor al 0.05, por lo que hay evidencia estadística
suficiente para rechazar H0, indicando que el valor de jubilación si difiere significativamente de
250000.

El intervalo de confianza, al tener valores negativos, indica que la media del valor de jubilación es
menor a 250000, por lo que la jubilación se encuentra por debajo de valor calculado por el experto
para el 2018.

Para saber entre qué valores está este valor, habrá que despejar el intervalo:
-26.879,7854 < µ -250.000 < -5.478,9183
-26.879,784 + 250.000 < µ - 250.000 + 250.000 < -5.478,9183 + 250.000
223.120,2146 < µ < 244.521,0817

2) Desde comienzo de este año 2020, la mayor preocupación a nivel mundial ha sido la
propagación del Covid-19 y las medidas que se deben tomar para controlar su propagación.
Con el fin de generar medidas para controlar los contagios, diversos expertos e investigadores
han estudiado distintos factores que podrían explicar esto.

En esta oportunidad, el archivo “Covid_Agosto.sav” tiene cierta información relacionada a la


pandemia en cada comuna del país, registradas al día 7 de agosto, y características propias de
cada una de éstas, tales como población comunal, estimación de personas en riesgo (ya sea
por enfermedades o por edad), cantidad de hogares hacinados, tasa de pobreza y tipo de zona
predominante en la comuna (urbano o rural).

Teniendo en cuenta que existe una gran dispersión entre la población de cada comuna del
país, en esta ocasión se busca estudiar la Tasa de Contagio Comunal, la cual es calculada como
la cantidad de casos confirmados hasta el 7 de agosto, respecto a la población total de la
comuna (cantidad de casos confirmados a la fecha en la comuna divididos en la población de
ésta).

Considerando que según cifras oficiales del MINSAL, al 12 de agosto un 69,7% de los casos
confirmados corresponden a la Región Metropolitana, utilice únicamente dicha Región para el
cálculo de lo siguiente:

Sintaxis:

USE ALL.
COMPUTE filter_$=(Cod_region = 13).
VARIABLE LABELS filter_$ 'Cod_region = 13 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
a) Genere una matriz de correlaciones bivariada con las variables que usted considere
necesarias para explicar la Tasa de Contagio Comunal. Analice los resultados y determine
qué variable sería la mejor candidata para explicar esta Tasa.

Sintaxis:

CORRELATIONS
/VARIABLES=tasa_cont Poblacion per_riesgo_com hogares_hacinados TasaPobreza
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.

H0: La correlación entre tasa de contagio comunal y el Puntaje X no es significativa.


H1: La correlación entre tasa de contagio comunal y el Puntaje X es significativa.
Dónde X = {Población comunal, Personas en riesgo por enfermedades y/o edad (estimación),
Hogares hacinados presentes en el Registro Social de Hogares según tramos de Clasificación
Socioeconómica (CSE), Tasa de pobreza multidimensional por comuna)

Solo se tiene una significancia de 0 < 0.05 en las variables Hogares hacinados presentes en el
Registro Social de Hogares según tramos de Clasificación Socioeconómica (CSE) y Tasa de pobreza
multidimensional por comuna, siendo la variable de hogares hacinados la que presenta una mayor
correlación (0.424), siendo esta la elegida para seguir trabajando.
b) Genere un gráfico de dispersión simple entre la Tasa de Contagio Comunal y la variable
que haya elegido en el punto anterior. Añada línea de tendencia e interprete el R2.

Sintaxis

GRAPH
/SCATTERPLOT(BIVAR)=hogares_hacinados WITH tasa_cont BY Comuna (IDENTIFY)
/MISSING=LISTWISE.

No se realiza filtro, ya que si bien se visualizan casos outlier son varios y en distintas partes del eje
que no fácilmente detectable cual quitar.

El coeficiente de determinación de bondad de ajuste del modelo lineal (R2) es 0.18, que indica que
el 18% de la variabilidad en la tasa de contagio comunal está siendo explicada por los Hogares
hacinados presentes en el Registro Social de Hogares según tramo de Calificación Socioeconómico
(CSE)
c) Ajuste un modelo de regresión lineal simple explicando la Tasa de Contagio Comunal,
considerando la variable ya escogida. Interprete el coeficiente R y el coeficiente de
determinación.
Sintaxis

REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT tasa_cont
/METHOD=ENTER hogares_hacinados
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/RESIDUALS NORMPROB(ZRESID)
/SAVE PRED ZPRED RESID ZRESID.

R toma el valor de 0.424 indica que existe una relación lineal moderada-débil entre la tasa de
contagios comunal y la variable Hogares hacinados presentes en el Registro Social de Hogares
según tramo de Calificación Socioeconómico (CSE).

R2 con el valor 0.18 indica que un 18% de la variabilidad en la tasa de contagios comunal está
siendo explicada por Hogares hacinados presentes en el Registro Social de Hogares según tramo
de Calificación Socioeconómico (CSE)
d) Evalúe la significancia de los coeficientes. Argumente correctamente.

Significancia de coeficientes:
H0: El coeficiente i no es significativo.
H1: El coeficiente i es significativo.
Donde i = {0, 1}
El intercepto posee una significancia del 0.004 y el coeficiente asociado a hogares hacinados posee
una significancia del 0.002, que ambas son menores al 0.05 por ende se posee evidencia
estadística para rechazar la hipótesis nula, por lo tanto, ambos coeficientes son estadísticamente
significativo

e) Escriba la ecuación obtenida del modelo e interprete la pendiente.

Ecuación:

Y = 0.016 + 0.001 ∙ X
Donde Y = Puntaje Tasa de contagio comunal y X = Puntaje de Hogares Hacinados

Se puede explicar que, ante el aumento de puntaje en la tasa de contagios comunal, en promedio
el puntaje de hogares hacinados aumenta en 0.001 puntos.
f) Verifique los supuestos de normalidad de los residuos y homocedasticidad.

Visualizando el gráfico PP, los puntos no están todos pegados a la línea de 45 grados por ende se
puede indicar el no cumplimiento del supuesto de normalidad de los residuos, pero esto se
verificará con una prueba de normalidad de los residuos estandarizados.

Sintaxis

EXAMINE VARIABLES=ZRE_1
/PLOT BOXPLOT STEMLEAF NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Observando la prueba de K-S se observa que no se rechaza la hipótesis de normalidad de los
residuos ya que la significancia es mayor al 0.05. Por ende, se puede hacer inferencia en la
población.

Para que se cumpla la hipótesis de homocedasticidad debe cumplir estos 3 puntos:


 Ya que ningún punto sale del -3 y 3
 No hay gran concentración de puntos
 No existen patrones
De acuerdo con los puntos anteriores, se percibe que si existe una concentración de puntos por
ende no se cumple la hipótesis de homocedasticidad,

g) Evalúe si al agregar la variable dummy “Zona” como otra variable independiente, resulta
significativa para el modelo. Justifique claramente.
Sintaxis

REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT tasa_cont
/METHOD=ENTER hogares_hacinados Zona
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/RESIDUALS NORMPROB(ZRESID)
/SAVE PRED ZPRED RESID ZRESID.

Se observa una mejora en el modelo, ya que ahora R 2 obtiene un valor de 0.203 lo que indica que
la tasa de contagio comunal está siendo explicada por el 20.3% por los hogares hacinados y la
variable que indica que tipo de zona es, si es rural o urbana.

H0: El coeficiente asociado a la variable dummy que indica si la zona es urbana o rural, no es
significativa.
H1: El coeficiente asociado a la variable dummy que indica si la zona es urbana o rural, es
significativa.
Al tener una significancia de 0 < 0.05 indica que hay evidencia para rechazar la hipótesis nula, por
ende se acepta que la variable dummy es significativa en el modelo

También podría gustarte