Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Para revisar la calidad de los datos en las variables vamos a revisar primero si hay datos
perdidos que influyan en el análisis y si los datos de las variables a estudiar siguen una
distribución normal o no.
Tabla 1: Estadísticos
Análisis Bivariados 2
Guía 3 Metodología Avanzada
De los 527 estudiantes que asisten a una Universidad, 3 de ellos no indicaron información
sobre ingresos familiares y 9 no indican su puntaje PSU, estos datos perdidos son
reconocidos por el sistema sin embargo su ausencia no influirá significativamente en el
resultado de los análisis.
Dentro de esta lectura rápida podríamos también interpretar los datos arrojados por la
tabla de estadísticos y tipificar el valor del índice de curtosis dividiendo su curtosis por su
error típico. Por ej. En el caso del nivel educativo de la mamá su curtosis/error tip. = 3.86 ya
que la curtosis es más del doble de su error tip. El índice es demasiado grande para ser
normal, lo que nos da una idea de su distribución. En el caso de los ingresos familiares
tenemos un valor de 17.71 lo que es demasiado alto, indicando no solo que no son normales
si no que están muy concentrados en uno de sus lados. Tanto en el puntaje PSU como en el
promedio de notas obtenemos valores mayores a dos por lo que podemos deducir que su
distribución tampoco es normal, estos valores son 3,24 y 4,15 respectivamente. Esto lo
vamos a verificar más adelante mediante la aplicación de una prueba de normalidad.
Variables continuas:
En el caso de las variables que vamos a analizar los Ingresos familiares, puntajes PSU y
Promedio de Notas cumplen con el supuesto de tratarse de Variables continuas, todas ellas
escalares. No así del nivel educativo de la madre que es una variable más bien categórica
(Nominal) que podemos ordenar de menor a mayor (Ordinal).
Linealidad:
Antes de generar los gráficos de dispersión de datos vamos a establecer entre que variables
existe correlación (Revisar ejercicio 6) y comprobaremos este supuesto solo en ellos:
Análisis Bivariados 2
Guía 3 Metodología Avanzada
Análisis Bivariados 2
Guía 3 Metodología Avanzada
Análisis Bivariados 2
Guía 3 Metodología Avanzada
Outliers
En las variables Q7_1 “Puntaje PSU” se identifican mediante la lectura de un gráfico de caja
(6) datos atípicos (2) de ellos con puntajes muy bajos, es decir bajo el límite inferior del
rango intercuartil, dos puntajes menores o iguales a 400 puntos. Por el contrario (4)
estudiantes tuvieron puntajes muy altos, sobre el límite superior del rango intercuartil con
los puntajes 776, 780, 817 y 850 respectivamente.
En la variable PROMEDIO DE NOTAS se encuentran (10) casos atípicos, uno de ellos con
promedio inferior a 4 y los otros (9) sobre el límite superior del rango intercuartil con
promedios de notas superior a 6 con notas 6,4 - 6,5 – 6,8 y 7. Representando estos solo el
0,9% del total de estudiantes.
Para verificar nuestra deducción de una distribución no normal vamos a aplicar una prueba
de normalidad, que, en este caso, tratándose de más de 350 estudiantes en la muestra será
el estadístico Kolmogorov-Smirnov (K-S).
Tabla 2: Pruebas de normalidad
Kolmogorov-Smirnov Shapiro-Wilk
Análisis Bivariados 2
Guía 3 Metodología Avanzada
Pese a que las pruebas de K-S no indicaron que no existe D.N revisando los gráficos Q-Q de
los puntajes PSU podríamos decir que, salvo los datos atípicos, si hay una distribución
relativamente normal. No así con el resto de variables.
Estas distribuciones con niveles altos de curtosis y asimetrías, con concentración de datos
en grupos o intervalos específicos son explicados por la propia naturaleza de las variables.
Análisis Bivariados 2
Guía 3 Metodología Avanzada
Dado que Pearson asume que todas las variables seguirán una distribución normal y en
este caso dos o más variables no cumplen con este supuesto, así como tampoco se
cumple con los supuestos de linealidad y hay presencia de datos atípicos se considera
que el estadístico más adecuado a utilizar en este caso es el Rho de Spearman.
Tabla 3: Correlaciones
De la misma forma, pero con correlaciones bajas, pero significativas, se aprecia una relación
entre el nivel educativo de la madre y los indicadores académicos del estudiante, es decir
el puntaje PSU (Q7_1) y promedio de notas (x: 0,160; p:0,00) y (x: 0,159; p:0,00)
respectivamente.
Análisis Bivariados 2
Guía 3 Metodología Avanzada
También podemos interpretar que los niveles de ingresos familiar guardan una relación
débil (Despreciable a criterio de Sierra Bravo) con los resultados y rendimiento académico
del estudiante (puntaje PSU y promedio de notas) de coeficiente y significancia: (x: 0,097;
p: 0,028) y (x: 0,104; p: 0,017) en ese mismo orden. Sin embargo, presentan un valor p
menor que el nivel de significancia estándar de 0,05, por lo que dicha correlación es
significativa. Esto nos indicaría que si bien no es determinante el nivel de ingresos en los
resultados académicos sí podrían influir aquellos casos particulares donde existe relación el
tipo de establecimiento en el que estudia (particular o no), por tanto, nivel de calidad en la
educación temprana, capital cultural adquirido y otros. Sería este el caso de un estudiante
que con buen nivel de ingresos familiares se pueda permitir una educación particular,
mantenga un buen promedio de notas y obtenga un puntaje PSU alto.
La última correlación es según Coltón Excelente ya que casi llega al valor 1. (x: 0,992; p:0,00)
Esto se sustenta básicamente en que ambas variables miden el mismo indicador, es decir
tanto el puntaje PSU como Promedio de Notas miden rendimiento académico por lo que es
altamente probable que un estudiante que tenga un alto promedio de notas obtenga un
alto puntaje PSU.
Análisis Bivariados 2
Guía 3 Metodología Avanzada
R: 527 Estudiantes.
En primer lugar, tanto las variables Q19 como Q18 están segmentadas por tipo de objeto o
actividades culturales, por lo que deberemos crear una nueva variable que promedie los
conjuntos mencionados. Estas nuevas variables serán “Objetos_culturales” y
“Actividades_culturales”.
Tabla 4: Estadísticos
Análisis Bivariados 2
Guía 3 Metodología Avanzada
El sistema nos arroja un total de 28 datos perdidos de los cuales 9 corresponden a la variable
Q7_1 y 19 a la variable recién creada Objetos culturales.
Variables continuas:
En el caso de las variables que vamos a analizar los Ingresos familiares, puntajes PSU y
Promedio de Notas cumplen con el supuesto de tratarse de Variables continuas, todas ellas
escalares. No así con los objetos, que son categóricos o nominales. La frecuencia con la que
se realiza las actividades están numeradas del 1 al 5, asignando valores categóricos que si
bien se pueden ordenar no representan un orden jerárquico y solo se puede medir de forma
discreta, es decir tomando número enteros.
Linealidad
Antes de generar los gráficos de dispersión de datos vamos a establecer entre que variables
existe correlación (Revisar ejercicio II.6) y comprobaremos este supuesto solo en ellos:
Entre las variables relacionadas solamente el puntaje PSU y el promedio de notas presentan
una correlación bivariada Lineal.
Análisis Bivariados 2
Guía 3 Metodología Avanzada
Outliers
En las variables Q7_1 “Puntaje PSU” se identifican mediante la lectura de un gráfico de caja
(6) datos atípicos (2) de ellos con puntajes muy bajos, es decir bajo el límite inferior del
rango intercuartil, dos puntajes menores o iguales a 400 puntos. Por el contrario (4)
estudiantes tuvieron puntajes muy altos, sobre el límite superior del rango intercuartil con
los puntajes 776, 780, 817 y 850 respectivamente. **
En la variable PROMEDIO DE NOTAS se encuentran (10) casos atípicos, uno de ellos con
promedio inferior a 4 y los otros (9) sobre el límite superior del rango intercuartil con
promedios de notas superior a 6 con notas 6,4 - 6,5 – 6,8 y 7. Representando estos solo el
0,9% del total de estudiantes. Para mejorar la precisión de nuestros análisis vamos a aplicar
una selección de caso para trabajar solo con los promedios bajo 6, reduciendo los datos
atípicos. **
Kolmogorov-Smirnov Shapiro-Wilk
Análisis Bivariados 2
Guía 3 Metodología Avanzada
Kolmogorov-Smirnov Shapiro-Wilk
Análisis Bivariados 2
Guía 3 Metodología Avanzada
El valor p de la prueba K-S en el caso de los puntajes PSU nos indicaba una distribución
normal y nuestro gráfico Q-Q lo confirma. En el caso de las otras tres variables cuya
significancia era de 0,00 y que por tanto rechazaban H0 y no asumían normalidad. Los
gráficos Q-Q de todos ellos indica una concentración de los datos en la tendencia por lo que
se confirma que SI hay distribución normal.
Ya que nuestros gráficos Q-Q han complementado las pruebas de normalidad que
indicaban un nivel de significancia menor al 0,05 y hemos rectificado la información (si
tienen distribución normal) lo conveniente es hacer uso de una prueba paramétrica para
la correlación entre variables escalares deberemos utilizar Pearson.
Como dejamos establecido en la primera parte de esta guía según Coltón, observamos que
existe una relación “Excelente” entre el puntaje PSU (Q7_1) y el promedio de notas
(x: 0,987; p:0,00) y que esta relación es estadísticamente significativa. Ya que ambas
variables miden el mismo indicador es altamente probable que un estudiante que tenga un
alto promedio de notas tenga buenos hábitos de estudio y esté preparado para la
evaluación de selección universitaria y por tanto obtenga un alto puntaje PSU. Por lo mismo
Análisis Bivariados 2
Guía 3 Metodología Avanzada
se trata de una correlación lineal, como podemos observar en sus gráficos de dispersión, en
la que el aumento de una de las variables condiciona el aumento de la otra y viceversa.
De la misma forma, con correlaciones bajas, se aprecia una relación significativa entre los
objetos culturales y los indicadores académicos del estudiante; el puntaje PSU (x: 0,105; p:
0,022) y promedio de notas (x: 0,105; p: 0,021). Esta relación entre indicadores académicos
y el uso de objetos culturales puede estar explicado teóricamente por ideas como la del
capital cultural objetivado de Bourdieu. Pero más allá de eso podríamos interpretarlo de
varias maneras. Es posible que los estudiantes que utilizan más objetos culturales tengan
un mayor interés en el aprendizaje y en su formación académica en general, lo que se podría
reflejar en un mejor rendimiento académico. Además, el uso de objetos culturales podría
proporcionar a los estudiantes nuevas formas de aprender y comprender los conceptos. O
al contrario que aquellos estudiantes que tengan bajo rendimiento académico utilicen los
objetos culturales como refugio, formas de distracción, etc. Sin embargo, como podemos
observar en los gráficos de dispersión (Grafico n.XX) a pesar que efectivamente si existe una
asociación estadísticamente significativa estas variables no se mueven de forma conjunta,
es decir no genera una linealidad y por lo tanto no podemos afirmar que “a mayor puntaje
PSU o promedio de Notas mayor objetos culturales” o que “a mayor objetos culturales
mayor rendimiento académico”. En cualquier casi es relevante y debemos considerar la
presencia de otros factores como la motivación, nivel socioeconómico, nivel cultural,
ambiente escolar, etc.
Análisis Bivariados 2