Está en la página 1de 5

CONSULTAS RSTUDIO

MATERIA: CIENCIA DE LOS DATOS. PROFESORA: ANAYANSI CRISTINA


HERNÁNDEZ ABREGO. HORA: 7 A 8 A.M.

12 DE DICIEMBRE DE 2019
ALUMNA: MARTÍNEZ LÓPEZ STEPHANIE ANAID
INSTITUTO TECNOLÓGICO DE OAXACA – TECNOLÓGICO NACIONAL DE MÉXICO
SCRIPT CONSULTAS
##CARGAR LIBRERÍAS

library(dplyr)

library(tidyr)

library(ggplot2)

materias <- filter(kardex, asignatura)

View(materias)

qplot(x = semestre, y = promedio, data = kardex)

#CARGAR ARCHIVO

kardex <- read.csv("C:/Users/Stephanie


Martínez/Desktop/FinalCiencia/KardexEstudiantes.csv")

#CONSULTA 1 SACAR UNA GRAFICA DONDE MUESTRE CADA UNA DE LAS MATERIAS
X=semestre, Y=calificaciones

qplot(x = semestre, y = promedio, data = kardex)

dev.off()

x11()

matXsemestre <- ggplot(kardex, aes(x=semestre, y=promedio, group=0))+


geom_point()

matXsemestre+ facet_wrap(~asignatura)

plot(matXsemestre)

GRÁFICA:
#CONSULTA 2 TOP 5 DE MATERIAS CON MAYOR INDICE DE REPROBACION

##CORRECCION_INDICE

materiasR <- filter(kardex, promedio==0)

materias.rep <- select(materiasR, asignatura) %>% group_by(asignatura) %>%


tally()

conteo.materias <- select(kardex, asignatura) %>% group_by(asignatura) %>%


tally()

juntar.materias <- inner_join(materias.rep, conteo.materias, by = c("asignatura"))

Rankeo <- mutate(juntar.materias, Indice = (n.x/n.y)*100)

top <- arrange(Rankeo, desc(Indice))

top3 <- top[1:5,]

View(top3)

ggplot(top3, aes(x=asignatura, y=Indice))+ geom_point()

plot(top3)

GRÁFICA:
#CONSULTA 3 PROMEDIOS MAS ALTOS DE LA CARRERA

topPromedio <- arrange(Rankeo, Indice)

top5promedio <- topPromedio[1:5,]

View(top5promedio)

ggplot(top5promedio, aes(x=asignatura, y=Indice))+ geom_col()

GRÁFICA:

#CONSULTA 4 COMPARAR EL PROMEDIO DE LAS QUE TIENEN MAYOR INDICE DE


REPROBACION CON TU PROMEDIO

mi.prom <- filter(kardex, estudiante == 15161446)

buscarEn.poo <- filter(mi.prom, asignatura == "PROG. ORIENTADA A OBJETOS")

buscarEn.poo.kardex <- filter(kardex, asignatura == "PROG. ORIENTADA A


OBJETOS")

promediosTodos.poo <- select(buscarEn.poo.kardex, promedio)

suma.promediosTodos.poo <- sum(promediosTodos.poo$promedio)/77

mi.promedioS.poo <- sum(buscarEn.poo$promedio)/3

comparo.promediosTodos.2 <- data.frame("Alumno" = c("16161363","General"),


"Promedio_Grl" = c(mi.promedioS.poo,
suma.promediosTodos.poo))

ggplot(comparo.promediosTodos.2, aes(x=Alumno, y=Promedio_Grl)) +


geom_col()

GRÁFICA:

También podría gustarte