Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guaillas Robert CBCEESTAJUS U2 T2
Guaillas Robert CBCEESTAJUS U2 T2
UNIDAD2:TAREA2
Para resolver los ejercicios de esta tarea se recomienda crear un proyecto llamado
U2EST T2
1. Un entusiasta de las caminatas tiene una nueva aplicación para su teléfono inteligente que
resume sus caminatas usando un dispositivo GPS. Veamos la distancia recorrida (en km)
y la altitud máxima (en m) durante las últimas 10 caminatas:
Distancia 12,5 29,9 14,8 18,7 7,6 16,2 16,5 27,4 12,1 17,5
Altitud 342 1245 502 555 398 670 796 912 238 466
# EJERCICIO 1
# Datos de distancia y altitud
distancia <- c(12.5, 29.9, 14.8, 18.7, 7.6, 16.2, 16.5, 27.4, 12.1, 17.5)
altitud <- c(342, 1245, 502, 555, 398, 670, 796, 912, 238, 466)
#...........LITERAL A............
media_distancia <- mean(distancia)
mediana_distancia <- median(distancia)
#...........LITERAL B............
cuartiles_distancia <- quantile(distancia, probs = c(0.25, 0.75) )
cuartiles_altitud <- quantile(altitud, probs = c(0.25, 0.75) )
#...........LITERAL E............
altitud_promedio_pies <- media_altitud * 3.28
#...........LITERAL F............
boxplot(distancia, main = "Diagrama de caja - Distancia")
boxplot(altitud, main = "Diagrama de caja - Altitud")
2. El conjunto rankingconstruccion.csv contiene los datos del año 2018 de las empresas que
se dedican al sector de la construcción. La revista Vistazo elabora cada año un ranking
de las empresas por cada sector de la producción al que pertenecen las empresas y un
ranking general. Investigue el uso de la función top_n y con la ayuda de esta función
seleccione las primeras 500 empresas de acuerdo con la utilidad, almacene estos
resultados en el un conjunto llamado rank500_construccion y de este conjunto de datos,
realice los siguientes ejercicios:
a) Elabore una tabla de frecuencia con las utilidades de las empresas.
b) Elabore una tabla de frecuencia de las empresas de acuerdo al sector.
c) Elabore una tabla de frecuencia con las ventas de las empresas.
d) Elabore una tabla de contingencia que relacione el tamaño de la empresa con la
región a la que pertenece la empresa.
e) Construya un diagrama de barras de las empresas por tamaño.
f) Construya un diagrama de barras de las empresas por tamaño de acuerdo a la
región.
g) Determine las medidas de tendencia central y de dispersión de las ventas de
acuerdo a la región, almacene los resultados en una tabla llamada
‘ventasconstruccion‘ y guarde sus resultados en una hoja de cálculo.
h) Determine los tres cuartiles de las utilidades de acuerdo al tipo de compañía.
i) Elabore el diagrama de caja de las utilidades.
j) Elabore el diagrama de caja de las utilidades de acuerdo al tipo de compañía.
# EJERCICIO 2
library(readxl)
View(rankingconstruccion)
tabla_utilidades
tabla_empresas_sector
tabla_ventas
# d) Elabore una tabla de contingencia que relacione el tamaño de la empresa con la región.
tabla_contingencia
barplot(table(rankingconstruccion$TAMAÑO))
barplot(table(rankingconstruccion$TAMAÑO, rankingconstruccion$REGIÓN))
ventas_construccion
cuartiles_utilidades
boxplot(rankingconstruccion$UTILIDAD)
# EJERCICIO 3
# a) Cargar cada conjunto de datos por separado
library(readxl)
rankingagricultura <- read_excel("rankingagricultura.xlsx")
View(rankingagricultura)
library(readxl)
rankingcomercio <- read_excel("rankingcomercio.xlsx")
View(rankingcomercio)
library(readxl)
rankingconstruccion <- read_excel("rankingconstruccion.xlsx")
View(rankingconstruccion)
library(readxl)
rankinginmobiliaria <- read_excel("rankinginmobiliaria.xlsx")
View(rankinginmobiliaria)
library(readxl)
rankingmanufactura <- read_excel("rankingmanufactura.xlsx")
View(rankingmanufactura)
# b) Unir los conjuntos de datos en un solo conjunto utilizando la función rbind():
ranking2018todos <- rbind(rankingagricultura, rankingcomercio, rankingconstruccion,
rankinginmobiliaria, rankingmanufactura)
# c) Seleccionar las primeras 500 empresas de acuerdo a la utilidad utilizando la función
top_n() y guardar el resultado en el conjunto ranking2018todos
library(dplyr)
ranking2018todos <- ranking2018todos %>%
arrange(desc(UTILIDAD)) %>%
slice(1:500)
# 1) Calcular las medidas de tendencia central y dispersión por sector de las utilidades
medidas_por_sector <- ranking2018todos %>%
group_by(SECTOR_PROD) %>%
summarise(media = mean(UTILIDAD), mediana = median(UTILIDAD), desviacion =
sd(UTILIDAD))
# 2) Determinar los deciles de las utilidades para todas las empresas
deciles_todas_empresas <- quantile(ranking2018todos$UTILIDAD, probs = seq(0.1, 0.9, 0.1))
# 3) Determinar los deciles de las utilidades por sector
deciles_sector <- ranking2018todos %>%
group_by(SECTOR_PROD) %>%
summarise_at(vars(UTILIDAD), ~quantile(., probs = seq(0, 1, by = 0.1)))
# 4) Elaborar tablas de contingencia relacionando el sector y el tamaño de las empresas
tabla_contingencia <- table(ranking2018todos$SECTOR_PROD, ranking2018todos$TAMAÑO)
# 5) ¿De qué ciudad son la mayoría de empresas del ranking? Elabore una tabla de frecuencia
de las empresas por ciudad
tabla_frecuencia_ciudad <- table(ranking2018todos$CIUDAD)
# 6) ¿A qué sector productivo pertenecen la mayoría de empresas del ranking?
sector_mayoria <- names(which.max(table(ranking2018todos$SECTOR_PROD)))
# EJERCICIO 4
library(readxl)
pizza_delivery <- read_excel("pizza_delivery.xlsx")
View(pizza_delivery)
library(tidyverse)
# a) Calcular la media, la mediana, el mínimo, el máximo, el primer cuartil y el tercer cuartil para todas
las variables cuantitativas