Está en la página 1de 14

Datos del alumno Fecha

Nombres: Stefano Sebastián


23/12/2022
Apellidos: Mogrovejo Morales

Trabajo con R y Rstudio


ESTADÍSTICA
UNIDAD 2: TAREA 2
1. Un entusiasta de las caminatas tiene una nueva aplicación para su teléfono inteligente
que resume sus caminatas usando un dispositivo GPS. Veamos la distancia recorrida
(en km) y la altitud máxima (en m) durante las últimas 10 caminatas:

a) Calcule la media aritmética y la mediana tanto para la distancia como para la


altitud

b) Determine el primer y tercer cuartiles para las variables de distancia y altitud


UNIVERSIDAD POLITÉCNICA SALESIANA

c) Analice la forma de la distribución dados los resultados de a) y b)


• Los valores obtenidos en a y b no se asemejan debido a las diferencias de cálculos
que se utilizo para cada literal.
d) Calcule el rango intercuartílico, la desviación media absoluta y la desviación
estándar para ambas variables. ¿Cuál es su conclusión sobre la variabilidad de los
datos?

e) Un metro corresponde a aproximadamente 3.28 ft. ¿Cuál es la altitud promedio


cuando se mide en ft en lugar de metros?

f) Dibuje e interprete el diagrama de caja tanto para la distancia como para la altitud

2
UNIVERSIDAD POLITÉCNICA SALESIANA

2. El conjunto rankingconstruccion.csv contiene los datos del año 2018 de las empresas
que se dedican al sector de la construcción. La revista Vistazo elabora cada año un
ranking de las empresas por cada sector de la producción al que pertenecen las
empresas y un ranking general. Investigue el uso de la función top_n y con la ayuda
de esta función seleccione las primeras 500 empresas de acuerdo con la utilidad,
almacene estos resultados en un conjunto llamado rank500_construccion y de este
conjunto de datos, realice los siguientes ejercicios:
a) Elabore una tabla de frecuencia con las utilidades de las empresas

b) Elabore una tabla de frecuencia de las empresas de acuerdo con el sector

3
UNIVERSIDAD POLITÉCNICA SALESIANA

c) Elabore una tabla de frecuencia con las ventas de las empresas

d) Elabore una tabla de contingencia que relacione el tamaño de la empresa con la


región a la que pertenece la empresa

4
UNIVERSIDAD POLITÉCNICA SALESIANA

e) Construya un diagrama de barras de la empresa por tamaño

f) Construya un diagrama de barras de la empresa por tamaño de acuerdo con la


región

5
UNIVERSIDAD POLITÉCNICA SALESIANA

g) Determine las medidas de tendencia central y de dispersión de las ventas de


acuerdo con la región, almacene los resultados en una tabla llamada
“ventasconstruccion” y guarde sus resultados en una hoja de cálculo

h) Determine los tres cuartiles de las utilidades de acuerdo con el tipo de compañía

6
UNIVERSIDAD POLITÉCNICA SALESIANA

i) Elabore el diagrama de caja de las utilidades

j) Elabore el diagrama de caja de las utilidades de acuerdo con el tipo de compañía


3. En el ejercicio anterior se elaboro el ranking de las empresas del sector construcción,
la revista Vistazo publica además un ranking de las mejores 500 mejores empresas
utilizando los archivos de valores separados por comas (csv) rankingagricultura,
rankingcomercio, rankingconstruccion, rankinginmobiliaria y rankingmanufactura. El
flujo de trabajo recomendado para esta actividad es:
a) Cargar cada conjunto de datos por separado, almacenando cada conjunto en una
variable que usted decida

7
UNIVERSIDAD POLITÉCNICA SALESIANA

b) Unir los conjuntos de datos en un solo conjunto, para esto se debe utilizar la
función rbind(). Investigue el uso de esta función y utilícela para formar un único
conjunto de datos

c) Con ayuda de la función top_n() seleccione las primeras 500 empresas de acuerdo
a la utilidad. Guarde este ranking en un conjunto llamado ranking2018todos. Con
el conjunto ranking2018todos se pide:

1) Calcular las medidas de tendencia central y dispersión por sector de las


utilidades
8
UNIVERSIDAD POLITÉCNICA SALESIANA

2) Determinar los deciles de las utilidades para todas las empresas

3) Determinar los deciles de las utilidades por sector

9
UNIVERSIDAD POLITÉCNICA SALESIANA

4) Elaborar tablas de contingencia relacionando el sector y el tamaño de las


empresas

5) ¿de qué cantidad son la mayoría de las empresas del ranking? Elabore una
tabla de frecuencia de las empresas por ciudad

10
UNIVERSIDAD POLITÉCNICA SALESIANA

6) ¿a qué sector productivo pertenecen la mayoría de las empresas del ranking?

4. Los datos de entrega de pizzas (pizza_delivery.csv) son un conjunto de datos simulados.


Los datos se refieren a un restaurante que ofrece pizza a domicilio. Contiene los
pedidos recibidos durante un periodo de un mes: mayo de 2014. Hay tres sucursales
del restaurante. La entrega de pizzas se gestiona de forma centralizada: un operador
recibe una llamada telefónica y gestiona el pedido a la sucursal más cercana a la
dirección del cliente. Uno de los cinco conductores (dos de los cuales solo trabajan a
tiempo parcial los fines de semana) entregan el pedido. el conjunto de datos captura
la cantidad de pizzas ordenadas, así como la factura final, que también puede incluir
bebidas, ensaladas y platos de pasta. El dueño del negocio observo un mayor numero
de quejas, principalmente porque las pizzas llegan demasiado tarde y demasiado frías.
Para mejorar la calidad del servicio de su negocio, el propietario quiere medir (i) el
tiempo desde la llamada hasta la entrega y (ii) la temperatura de la pizza a la llegada
(lo que se puede hacer con un dispositivo especial). Idealmente, una pizza llega dentro
de los 30 minutos posteriores a la llamada: si tarda más de 40 minutos, se promete a
los clientes una botella de vino gratis (aunque no siempre se entrega). La temperatura
de la pizza debe estar por encima de los 65° en el momento de la entrega. El análisis
de los datos tiene como objetico determinar los factores que influyen en el tiempo de
entrega y la temperatura de las pizzas.
a) Calcule la media, la mediana, el mínimo, el máximo, el primer cuartil y el tercer
cuartil para todas las variables cuantitativas

6) ¿a qué sector productivo pertenecen la mayoría de las empresas del ranking?

11
UNIVERSIDAD POLITÉCNICA SALESIANA

b) Determine e interprete el percentil 99 para el tiempo de entrega y la temperatura

12
UNIVERSIDAD POLITÉCNICA SALESIANA

La pizza llegará después de los 40 minutos establecidos, pero mantendrá una buena
temperatura al momento de su llegada.
c) Grafique un diagrama de caja para el tiempo de entrega y la temperatura

13
UNIVERSIDAD POLITÉCNICA SALESIANA

d) Construya una tabla de frecuencias para el tiempo de entrega

e) Construya una tabla de frecuencias para la temperatura.

14

También podría gustarte