Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Se realiza un análisis factorial sin rotación, con rotaciones oblicuas (Criterio Oblimin y
promax) y ortogonales ( varimax, quartimax y equamax) y utilizando la máxima
verosimilitud como estimador, de tres a cinco factores.
En la figura 4, se observa las variables resale value y space comfort aportan las mayores
cargas al modelo.
5
Análisis descriptivo:
La base de datos “mtcars” suministrada, contenía 32 registros con 11 variables, sin presentar
datos faltantes. De la base se extrae la variable hp y las variables predictoras mpg, disp, drat,
wt, qsec y realizó alistamiento de la base de datos con una descripción inicial de la
distribución de las variables en donde se encontró una distribución heterogénea de las
variables (ver tabla 4)
entre las variables peso (wt) y millas por galón (mpg) una correlación negativa de -0.87. (ver
figura 5).
Figura 5. Correlograma de Pearson de las variables funcionamiento y características de
automóviles
Las variables con factores de inflacion de la varianza (VIF) tanto para wt, disp. como
para mpg es mayor que 5. (ver figura 6).
7
Después, se realizó un scree plot para identificar el número de factores potenciales basados
en los autovalores, en componente principales, coordenadas óptimas o el factor de
aceleración (Figura 8).
Figura 8. Scree plot componentes principales, coordenadas optimas o factor aceleración.
Dado que los scree plot indicaron que con solo un componente eran necesarios para realizar
un modelo adecuado.
Ahora bien, cuando se realiza el resumen del análisis de componentes se demostró que en los
dos primeros componentes se acumula el 89.35% de los datos (ver tabla 6 y figura 9).
Ahora bien, se realizó el modelo de regresión con dos componentes principales para
explicar la variable potencia bruta (hp) donde se obtuvo un p valor de 0.881 y un R
cuadrado ajustado de -0.0325 lo cual no es significante el modelo. Sin embargo, se realizó
un modelo con las variables predictoras y los dos componentes principales y por medio de
la función “step” se identificó el modelo que tenia el menor criterio de Akaike (AIC) (ver
tabla 7).
R-cuadrado
-0.03256 0.7955 0.4691 0.8049 0.485
ajustado
Valor p 0.8819 <0.001 <0.001 <0.001 <0.001
AIC 367.21 324.97 347.46 319.01 344.95
El mejor modelo que explica la relación entre las variables y los dos componentes es el
modelo RLMACP3, modelo que incluye las variables predictoras qsec, disp., wt y la
primera componente y menor AIC (319.01), el mayor R-cuadrado ajustado (0.8049), se
recalca que se rechazó el supuesto de normalidad de los residuales. No obstante, el análisis
residual, se evidenció dos outlier 31 y 9 (ver figura 10)
10