Está en la página 1de 12

ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

ANALISIS EXPLORATORIO DE DATOS PARA CADA UNA DE LAS VARIABLES

𝑌1 : api00, rendimiento académico de la escuela.

𝑋1 : acs_k3, tamaño promedio de la clase en kindergarten hasta el 3er grado.

𝑋2 : meals, porcentaje de estudiantes que reciben comidas gratis.

𝑋3 : full, porcentaje de maestros que tienen credenciales completas de enseñanza.

TABLA COMPACTA CON SUMARIO ESTADISTICO

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

VARIABLE: api00

De la tabla compacta podemos ver que 𝑌̅1 > 𝑀𝑒𝑌1 , y una asimetría positiva, lo cual es
consistente.

La asimetría positiva nos indica una mayor concentración de valores a la derecha de la media.

No rechazamos H0, por lo que no hay evidencia para sostener que la distribución no es
simétrica.

Con un Pvalor menor a 0.05, concluimos que los datos se distribuyen de manera anormal.

El gráfico también nos confirma que los datos no se


distribuyen de manera normal.

Asimetría positiva con cola a la derecha.

Ligeramente podemos ver que el bigote de arriba


es más grande que el de abajo, asimetría positiva.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

VARIABLE: acs_k3

De la tabla compacta podemos ver que ̅̅̅


𝑋1 > 𝑀𝑒𝑋1 , y una asimetría negativa, lo cual es
inconsistente.

No rechazamos H0, por lo que no hay evidencia para sostener que la distribución no es
simétrica.

Con un Pvalor menor a 0.05, concluimos que los datos se distribuyen de manera anormal.

El gráfico también nos confirma que los datos no se


distribuyen de manera normal.

Asimetría negativa con cola a la izquierda.

Notamos presencia de 4 datos atípicos.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

VARIABLE: meals

De la tabla compacta podemos ver que ̅̅̅


𝑋2 < 𝑀𝑒𝑋2 , y una asimetría negativa, lo cual es
consistente.

Rechazamos H0, por lo que los datos no son simétricos.

Y con un Pvalor menor a 0.05 concluimos que los datos no siguen una distribución normal.

El gráfico también nos confirma que los datos no se


distribuyen de manera normal.

Asimetría negativa con cola a la izquierda.

Aquí podemos observar claramente una asimetría


negativa ya que el bigote de arriba es más pequeño
que el de abajo.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

VARIABLE: full

De la tabla compacta podemos ver que ̅̅̅


𝑋3 < 𝑀𝑒𝑋3 , y una asimetría negativa, lo cual es
consistente.

Rechazamos H0, por lo que los datos no son simétricos.

Y con un Pvalor menor a 0.05 concluimos que los datos no siguen una distribución normal.

El gráfico también nos confirma que los datos no se


distribuyen de manera normal.

Asimetría negativa con cola a la izquierda.

Aquí podemos observar claramente una asimetría


negativa ya que el bigote de arriba es más pequeño
que el de abajo, y también la presencia de datos
atípicos.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

REDACTE EL MODELO PLANTEADO

CONSIDERACIONES:

 Todas las variables son cuantitativas.


 Si realizamos un mapa de dispersión de api00 con cada una de las demás variables,
vemos que el modelo de regresión lineal es candidato.
 Con un análisis lógico de las variables podemos decir que el rendimiento académico de
la clase depende del tamaño de la misma, del porcentaje de estudiantes que reciben
comida gratis y del porcentaje de maestros con credenciales completas de enseñanza.

Definimos nuestras variables de trabajo:

𝑌1 : api00, rendimiento académico de la escuela.

𝑋1 : acs_k3, tamaño promedio de la clase en kindergarten hasta el 3er grado.

𝑋2 : meals, porcentaje de estudiantes que reciben comidas gratis.

𝑋3 : full, porcentaje de maestros que tienen credenciales completas de enseñanza.

En donde, 𝑌1 es la variable a estimar o explicar, y las 𝑋𝑖 nuestras variables explicativas. Por lo


que, la ecuación que describe la relación de 𝑌1 con las 𝑋𝑖 , es la siguiente,

MODELO DE REGRESIÓN: 𝑌1 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + u

En donde, a las variables ya definidas sumamos a u, que es un término de perturbación que


representa a todos los factores que afectan al rendimiento académico de la escuela que no se
están considerando en nuestro modelo de forma explícita.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

ESTIME EL MODELO DE REGRESIÓN

MODELO DE REGRESIÓN LINEAL MULTIPLE ESTIMADO : 𝑦 ̂0 + 𝛽


̂1 = 𝛽 ̂1 𝑥1 + 𝛽
̂2 𝑥2 + 𝛽
̂3 𝑥3

Ya que, 𝐸(u) = 0

Antes de realizar la estimación del modelo, nos aseguramos que todas las variables tengan la
misma cantidad de observaciones.

Y realizamos la estimación:

EVALÚE LA BONDAD DE AJUSTE DEL MODELO. INTERPRETE CADA UNO DE LOS ESTADÍSTICOS

Coeficientes de correlación de Pearson:

Notamos una baja asociación directa de Y con X1, alta asociación inversa de Y con X2, y una
asociación directa de y con X3, en donde todos los resultados son estadísticamente
significativos.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

Prueba F del modelo:

Prob > F = 0.0000, como es menor a 0.05 podemos concluir que al menos una de las
variables explicativas guarda relación lineal con Y.

Prueba t para cada una de las variables explicativas:

Notamos que acs_k3 no guarda relación lineal con Y, y el intervalo de confianza nos lo
confirma ya que contiene al cero.

Coeficiente de determinación:

R-squared = 0.8242

Las variables X1, X2 y X3 explican en un 82% el comportamiento de Y.

EVALÚE LA ADECUACIÓN DEL MODELO. INTERPRETE CADA UNO DE LOS ESTADÍSTICOS.

Evaluando Normalidad de los residuos,

Como Pvalue es mayor a 0.05, no rechazamos H0, es decir que no hay suficiente evidencia para
afirmar que los residuos se distribuyen de manera anormal.

Y aquí vemos que los residuos se distribuyen de


manera normal.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

Evaluando Homocedasticidad de los residuos

Pvalue es menor a 0.05 por lo que existe heterocedasticidad.

No se observa una banda, clara, de puntos.

Evaluando colinealidad:

Valores bajos del VIF nos indican que no existe colinealidad entras las variables explicativas.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

REALICE UN ANÁLISIS DE INFLUENCIA

Generamos las siguientes variables, y listamos las observaciones que cumplen con la condición
value.

K: número de variables explicativas.

N: tamaño de la muestra.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

Consideramos suprimir las variables que más se repiten:


observación Frecuencia
28 3
36 4
56 4
92 5
102 3
134 3
199 3
225 4
233 4
238 5
258 3
270 4
271 3
273 3
302 4
320 3
325 3
340 4
359 3

Al evaluar el modelo sin esas dos observaciones, vemos que el beta1 varia en casi un 100%, el
R2 ajustado aumenta, y acs_k3 sigue siendo una variable no significativa. Y aún existen
problemas de heterocedasticidad.
coeficientes N= 398 N=396 variación
acs_k3 -0.717 -1.3892 94%
meals -3.686265 -3.66 1%

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI


ESPECIALIZACIÓN EN ESTADÍSTICA APLICADA ESCUELA NACIONAL DE ESTADÍSTICA E INFORMÁTICA

full 1.327138 1.4663 10%

Sin considerar acs_k3


Sin considerar
ACS_K3, el R2
ajustado aumenta

Tanto manteniendo acs_k3, como excluyéndola del modelo aún existe problemas de
heterocedasticidad. Por lo que es recomendable realizar una transformación a las variables.

CONCLUSIONES FINALES

Si bien es recomendable realizar transformación de variables es claro el impacto (positivo o


negativo) de la variación de las variables explicativas sobre nuestra variable explicada (Y).

𝑌1 : api00, rendimiento académico de la escuela.

𝑋1 : Un aumento del tamaño promedio de la clase en kindergarten hasta el 3er grado reduce el
rendimiento académico de la escuela.

𝑋2 : Si el porcentaje de estudiantes que reciben comidas gratis aumenta, el rendimiento de la


clase disminuirá.

𝑋3 : Si el porcentaje de maestros que tienen credenciales completas de enseñanza aumenta, el


rendimiento de la clase aumentará.

ALUMNO: JONATAN ARAINGA DOCENTE: WILLER CHANDUVI

También podría gustarte