Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Prof. Jean
Taipe
Examen Final
27 enero 2024
Informe Examen Final
R Avanzado
2024-01-27
1. Parte Teórica
a) Clasificación y Clustering
b) Clasificación y Partición
c) Regresión y Clasificación
d) Regresión y K-Means
Pregunta 2: El análisis de Clúster es una técnica que se usa para agrupar casos en
grupos relativamente homogéneos llamados clúster
a) Verdadero
b) Falso
a) Verdadero
b) Falso
2. Parte Práctica
Solución:
Ruta de trabajo
Instalación de paquetes
install.packages("foreign")
install.packages("haven")
Carga de paquetes
library(foreign)
library(haven)
Análisis Descriptivo
install.packages("psych")
library(psych)
2. Desarrollar un análisis de correlaciones así como mostrar gráficos que
acompañen sus análisis.
Solución:
Visualización de Correlaciones
install.packages("PerformanceAnalytics")
library(PerformanceAnalytics)
INTERPRETACIÓN:
Del grafico se puede observar que existe una alta correlación entre las variables
ocu_vivi(hogares en cada vivienda) y pobjov(% Población en pueblos jóvenes) con
0.92 de correlación y entre las variables sinelect(% Población sin electricidad) y
sinagua (% Población sin agua) con una correlación de 0.92 y peam15(PEA menos de
15 años y pea1619(PEA entre 16 y 19 años) con 0.84 de correlación entre las variables.
install.packages("corrplot")
library(corrplot)
3. Testear los test de Bartlett y el Indicador KMO para verificar si las variables
están correlacionadas, interpretar los resultados.
Solución:
Test de Esferecidad de Barlett:
install.packages("psych")
library(psych)
INTERPRETACION
Indicador de KMO:
INTERPRETACION:
Como el KMO = 0.80 está entre 0.7 y 0.8, es aceptable aceptación muestral, sí habría
relación entre las variables.
4. En el caso de que haya correlaciones significativas en las variables determinar
el número de factores según análisis factorial.
Solución:
INTERPRETACION
Según el gráfico se elige 2 factores debido que los eigenvalue(autovalor) son mayores
que 1.
Solución:
install.packages("GPArotation")
library(GPArotation)
Rotación VARIMAX:
Análisis:
Para el Factor 1, las variables que tienen mayor peso son sinelect(0.953) y
sinagua(0.950), mientras que para el Factor 2 se tiene que las variables con mayor peso
de carga tiene ocu_vivi(0.957) y pobpjov(0.940).
INTERPRETACION: