Documentos de Académico
Documentos de Profesional
Documentos de Cultura
install.packages("tidyverse")
library("tidyverse")
library("readxl")
#Cargamos el dataset
ICFES = read_excel("BASEICFES.xlsx")
glimpse(ICFES)
#Crear nuevo data frame con los datos de los primeros 1000 puntajes
arrange((PUNT_GLOBAL))
#Seleccionar un grupo de variables para trabajar
select(ESTU_EDAD, ESTU_GENERO,COLE_AREA_UBICACION,FAMI_ESTRATO_VIVIENDA,
PUNT_GLOBAL)
select(-c(COLE_COD_MCPIO_UBICACION, ESTU_RESIDE_MCPIO))
names(Data.frame.origen) = c("Periodo","Año","Permanencia","Resultado_prueba")
summary(Becas_2)
Becas_2 %>%
a = Becas_2 %>%
b = Becas_2 %>%
summarise(
Promedio_F = mean(PUNT_GLOBAL),
Mediana_F = median(PUNT_GLOBAL),
Desviación_F = sd(PUNT_GLOBAL),
CV_F= Desviación_F*100/Promedio_F
b %>%
summarise(
Promedio_M = mean(PUNT_GLOBAL),
Mediana_M = median(PUNT_GLOBAL),
Desviación_M = sd(PUNT_GLOBAL),
CV_M= Desviación_M*100/Promedio_M
group_by(COLE_AREA_UBICACION) %>%
summarize(Cuentas = n(),
Porcentaje = n()*100/nrow(Becas_2))
Tabla1
group_by(FAMI_ESTRATO_VIVIENDA) %>%
summarize(Cuentas = n(),
Porcentaje = n()*100/nrow(Becas_2))
Tabla2
group_by(ESTU_GENERO) %>%
summarize(Cuentas = n(),
Porcentaje = n()*100/nrow(Becas_2))
Tabla3
#Diagrama de barras
ggplot(Tabla1, aes(x=COLE_AREA_UBICACION,y=Porcentaje))+
geom_bar(width=0.5,color="black",stat = "identity",fill="green",alpha=I(1))+
labs(x="Ubicación colegio")+
hist(Becas_2$PUNT_GLOBAL)
qplot(Becas_2$PUNT_GLOBAL,
geom="histogram",
fill=I("blue"),
col=I("black"),
alpha=I(0.5),
xlim=c(420,500))
ggplot(data=Becas_2, aes(ESTU_EDAD)) +
geom_histogram(color="black",fill="pink",alpha=I(0.3))+
labs(title="Histograma Edades",x="Edad",y="Frecuencia")+
xlim(c(14,20))
as = ggplot(Becas,aes(as.factor(COLE_AREA_UBICACION),PUNT_GLOBAL))+
geom_boxplot(fill="blue", color="black",alpha=I(0.5))
as
ggplot(ICFES,aes(as.factor(FAMI_ESTRATO_VIVIENDA),PUNT_GLOBAL))+geom_boxplot()
ggplot(Becas_2,aes(as.factor(ESTU_EDAD),PUNT_GLOBAL))+geom_boxplot()