Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Avanzado
Prof. Jean
Taipe
Examen
Final
Alumna: Charito
Medina Aldana
27 enero 2024
Informe Examen Final
R Avanzado
2024-01-27
1. Parte Teórica
a) Clasificación y Clustering
b) Clasificación y Partición
c) Regresión y Clasificación
d) Regresión y K-Means
Pregunta 2: El análisis de Clúster es una técnica que se usa para agrupar casos en
grupos relativamente homogéneos llamados clúster
a) Verdadero
b) Falso
a) Verdadero
b) Falso
2. Parte Práctica
Se tiene una data datadistritos.sav de 34 distritos donde se tiene información de % de
la población así como sus necesidades básicas, contiene 7 variables que son
características de cada distrito de Lima Metropolitana.
Solución:
Ruta de trabajo
Instalación de paquetes
install.packages("foreign")
install.packages("haven")
Carga de paquetes
library(foreign)
library(haven)
Análisis Descriptivo
install.packages("psych")
library(psych)
2. Desarrollar un análisis de correlaciones así como mostrar gráficos que
acompañen sus análisis.
Solución:
Visualización de Correlaciones
install.packages("PerformanceAnalytics")
library(PerformanceAnalytics)
INTERPRETACIÓN:
Del grafico se puede observar que existe una alta correlación entre las variables
ocu_vivi(hogares en cada vivienda) y pobjov(% Población en pueblos jóvenes) con
0.92 de correlación y entre las variables sinelect(% Población sin electricidad) y
sinagua (% Población sin agua) con una correlación de 0.92 y peam15(PEA menos de
15 años y pea1619(PEA entre 16 y 19 años) con 0.84 de correlación entre las variables.
install.packages("corrplot")
library(corrplot)
3. Testear los test de Bartlett y el Indicador KMO para verificar si las variables
están correlacionadas, interpretar los resultados.
Solución:
Test de Esferecidad de Barlett:
install.packages("psych")
library(psych)
INTERPRETACION
Indicador de KMO:
INTERPRETACION:
Como el KMO = 0.80 está entre 0.7 y 0.8, es aceptable aceptación muestral, sí habría
relación entre las variables.
4. En el caso de que haya correlaciones significativas en las variables determinar
el número de factores según análisis factorial.
Solución:
INTERPRETACION
Según el gráfico se elige 2 factores debido que los eigenvalue(autovalor) son mayores
que 1.
Solución:
install.packages("GPArotation")
library(GPArotation)
Rotación VARIMAX:
Análisis:
Para el Factor 1, las variables que tienen mayor peso son sinelect(0.953) y
sinagua(0.950), mientras que para el Factor 2 se tiene que las variables con mayor peso
de carga tiene ocu_vivi(0.957) y pobpjov(0.940).
INTERPRETACION: