Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ACP
Maestrı́a en Estadı́stica - UnalMed
Mariluz Trilleras Mota
Paola Ahumada Riaño
Marzo 20 2020
1
indican que sus distribuciones siguen una normal. Por esta razón sus valores son
aproximadamente iguales.
Asimismo se evidencia que la puntuación media más alta de las asignaturas
evaluadas en la ciudad de Medellı́n fue LECTURA CRITICA (54.75) y la pun-
tuación más baja fue CIENCIAS NATURALES (49.93), de ahı́ que el PUNTAJE
GLOBAL medio fue de 257.69
Finalmente, en estos resultados, el PUNTAJE GLOBAL tienen la mayor desvia-
ción estándar ( 51.24940), seguida PUNTAJE INGLES (52.90385). Esto indica
que estas dos puntuaciones presentan la mayor variabilidad. La LECTURA CRI-
TICA tiene la menor desviación estándar (10.11841) y la menor variabilidad.
2
PUNT_SOCIALES_CIUDADANAS 0.801 0.739 0.796
PUNT_INGLES 0.677 0.685 0.717
PUNT_GLOBAL 0.894 0.903 0.919
PUNT_SOCIALES_CIUDADANAS PUNT_INGLES PUNT_GLOBAL
LECTURA_CRITICA 0.801 0.677 0.894
PUNT_MATEMATICAS 0.739 0.685 0.903
PUNT_C_NATURALES 0.796 0.717 0.919
PUNT_SOCIALES_CIUDADANAS 1.000 0.693 0.916
PUNT_INGLES 0.693 1.000 0.800
PUNT_GLOBAL 0.916 0.800 1.000
En la gráfica anterior se observa que entre más grandes sean las bolas ma-
yor correlación hay entre las variables originales. Ahora bien, los resultados
de la correlación vemos que existe correlaciones significativas entre PUNTAJE
CIENCIAS NATURALES y PUNTAJE GLOBAL se tiene un valor de 0,91 de
correlación de estas dos variables, podemos ver una correlación significativa muy
importante también entre las variables PUNTAJE MATEMATICAS y PUNTA-
JE GLOBAL, LECTURA CRITICA y PUNTAJE GLOBAL.
Recordemos que la correlación es una matriz simétrica es decir los valores aij
son iguales a los valores aji . De este modo, se evidencia que existe correlación
3
entre las variables y por lo tanto se puede explicar la variabilidad original.
La primera CP es:
La segunda CP es:
La tercera CP es:
Importance of components:
4
En el primer componente principal explica el 82, 6 % de la variabilidad to-
tal, mientras que el componente principal dos explica el 5, 98 %, el componente
principal tres explica el 4, 93 %, el componente principal cuatro 3, 63 % y el
componente principal cinco el 2, 84 % fı́jese que cada vez va explicando menos
proporción porque la primera CP parece ser esencialmente un promedio ponde-
rado de las primeras tres variables. mientras que el componente principal dos
explica la variabilidad no explicada por el componente uno, el componente tres
explica la variabilidad no explicada por el componente principal dos y el com-
ponente principal uno y ası́ sucesivamente. Bien, podemos ver que la proporción
de la varianza acumulada para los tres primeros componentes principales es de
93, 51 %. Por lo tanto, la variación muestral puede ser resumida adecuadamente
por medio de las tres primeras componentes principales..
Component variances:
De estas componentes observamos cuales son las componentes que nos sirven.
En este caso observamos los componentes de las varianzas, todos los valores y
todos los componentes superiores o cercanos a 1 nos sirven para nuestro análisis.
Se observa que los tres primeros componente principales presentan componentes
principales mayores mientras que el resto presentan una varianza inferior. No
obstante, para hacer un poco más dinámico el ejercicio nos quedamos con los
tres primeros componentes principales y nos aseguramos de que, pues vamos a
explicar la mayor variabilidad posible de manera que se pierda la mı́nima infor-
mación.
> cp1
LECTURA_CRITICA PUNT_MATEMATICAS PUNT_C_NATURALES
-0.4010267 -0.4013415 -0.4118214
PUNT_SOCIALES_CIUDADANAS PUNT_INGLES PUNT_GLOBAL
-0.4085233 -0.3749953 -0.4483224
> cp2
LECTURA_CRITICA PUNT_MATEMATICAS PUNT_C_NATURALES
-0.31061178 -0.11050252 -0.05852376
PUNT_SOCIALES_CIUDADANAS PUNT_INGLES PUNT_GLOBAL
-0.24928005 0.90340774 -0.09797141
> cp3
LECTURA_CRITICA PUNT_MATEMATICAS PUNT_C_NATURALES
-0.51700830 0.68092140 0.32301578
PUNT_SOCIALES_CIUDADANAS PUNT_INGLES PUNT_GLOBAL
5
-0.36652013 -0.17107327 0.03325954
Se observa los tres primeros componente principales almacenados en cada
uno de los objetos. Por lo tanto podemos decir que esos tres primeros compo-
nentes principales podrı́an explicar el modelo.
6
Se observa el circulo de correlaciones que nos muestra la correlación que
existe entre mi componente principal que en este caso es el eje de las x y el
segundo componente principal que es el eje de las y. De este modo, se evidencia
que el CP1 explica mucho mejor las variables Puntaje global, Ciencias Natura-
les y Sociales. Mientras que el CP2 explica mucho mejor el puntaje de ingles,
Puntaje lectura crı́tica y Sociales.
7
[37,] -3.6301353335 -1.035624e+00 3.405879e-01
[38,] -3.6013546771 -1.053859e+00 3.135391e-01
[39,] -3.7763375521 1.684092e-01 5.748764e-01
[40,] -3.8286517650 -4.403000e-02 -6.890338e-01
[41,] -3.6296322676 -4.108581e-01 3.498334e-01
[42,] -3.6867992123 -4.618566e-01 -9.688023e-01
[43,] -3.4853617258 -6.470244e-01 4.626793e-01
[44,] -3.8232702158 5.441067e-01 -4.396716e-01
[45,] -3.4406913917 -1.165606e+00 -3.706948e-01
[46,] -3.5835971554 4.592012e-02 -2.549777e-01
[47,] -3.6872244161 3.575642e-01 -6.635664e-01
[48,] -3.4802958369 -1.875955e-01 -9.123229e-02
[49,] -3.6388116480 3.014937e-01 5.526232e-01
[50,] -3.6495097348 3.446839e-02 -8.133119e-01
[ reached getOption("max.print") -- omitted 25439 rows ]
8
estudiante con más alto en puntaje global, Ciencias Naturales y Sociales
Tenemos las coordenadas de los individuos que en este caso son los de más
9
alto puntaje en cada uno de los componentes, en este caso CP1 y CP3.
10
Se puede observar puntajes muy agrupados en el centro de los ejes esto nos
indica que esos puntajes en mayor medida se encuentran ubicados en esas coor-
denadas.
Código R
11
cp1
cp2=acp[[2]][,2] # segundo componente principal
cp2
cp3=acp[[2]][,3] # tercero componente principal
cp3
com_prin=cbind(cp1, cp2, cp3 ) # guarda los CP y los ordene mediante columnas
com_prin
individuos=acp$x[,1:3] # toma las primeras 3 coordenadas de los individuos
individuos
install.packages("ade4")
library(ade4)
x11() # ventana emergente
s.corcircle(com_prin[,-3], sub = "Componente Principal 1 y componente Principal 2",
possub="topright") # permite graficar la correlacion de los CP 1 y CP2
# se omite CP3#
x11()
s.label(individuos [,-3], label="DATOSMED2018.2", sub="Coordenada de los individuos",
possub="topright") # Grafica de las coordenada de los individuos.
12