Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com)
lOMoARcPSD|19271694
Desarrollo de la Actividad
UNIDAD 2: TAREA 6
1. Un entusiasta de las caminatas tiene una nueva aplicación para su teléfono inteligente que
resume sus caminatas usando un dispositivo GPS. Veamos la distancia recorrida (en km) y la
altitud máxima (en m) durante las últimas 10 caminatas
a) Calcule la media aritmética y la mediana tanto para la distancia como para la altitud.
Para la distancia tenemos que la media es de 17.32 y su mediana de 16.36, además su Q1 es de 13.075 y
Q3 es de 18.40. Por lo que, al parecer tiene un sesgo positivo o sesgo hacia la derecha.
Para la altitud tenemos el mismo caso ya que, la media es de 612.4 y la mediana es de 28.5, es decir que
la media está por encima de la mediana, además su Q1 es 415 y su Q3 es de 764.5. Por lo que, al parecer
también tiene un sesgo positivo.
d) Calcule el rango intercuartílico, la desviación media absoluta y la desviación estándar para ambas
variables. ¿Cuál es su conclusión sobre la variabilidad de los datos?
e) Un metro corresponde a aproximadamente 3.28 pies. ¿Cuál es la altitud promedio cuando se mide
en pies en lugar de metros?
f) Dibuje e interprete el diagrama de caja tanto para la distancia como para la altitud
a) Elabore una tabla de frecuencia con las utilidades de las empresas. Números de intervalos:
d) Elabore una tabla de contingencia que relacione el tamaño de la empresa con la región a la que
pertenece la empresa
g) Determine las medidas de tendencia central y de dispersión de las ventas de acuerdo a la región,
almacene los resultados en una tabla llamada
Al tener tantos valores extremos tanto como para la izquierda y la derecha, no se logra apreciar el
diagrama de caja y bigote.
Debido al tamaño del gráfico no se logra observar todas las etiquetas del tipo de compañía
3. En el ejercicio anterior se elaboró el ranking de las empresas del sector construcción, la revista Vistazo
publica además un ranking de las mejores 500 empresas de todos los sectores de acuerdo a su utilidad.
Elabore el ranking de las500mejores empresas utilizando los archivos de valores separados por comas
(csv) ranking agricultura, ranking comercio, ranking construcción, ranking inmobiliaria y ranking
manufactura. El flujo de trabajo recomendado para estas actividades:
a) Cargar cada conjunto de datos por separado, almacenando cada conjunto en una variable que usted
decida.
b) Unir los conjuntos de datos en un solo conjunto, para esto debe utilizar la función rbind( ).
Investigue el uso de esta función y utilícela para formar un único conjunto de datos.
c) Con ayuda de la función top n ( ) seleccione las primeras 500 empresas de acuerdo a la utilidad.
Guarde este ranking en un conjunto llamado ranking2018todos.Conel
conjuntoranking2018todossepide:
1) Calcular las medidas de tendencia central y dispersión por sector de las utilidades.
5) ¿De qué ciudad son la mayoría de empresas del ranking? Elabore una tabla de frecuencia de las
empresas por ciudad.
4. Los datos de entrega de pizzas (pizza delivery.csv) son un conjunto de datos simulados. Los datos se
refieren a un restaurante que ofrece pizza a domicilio. Contiene los pedidos recibidos durante un
período de un mes: mayode2014. Hay tres sucursales del restaurante. La entrega de pizzas se gestiona
de forma centralizada: un operador recibe una llamada telefónica y reenvía el pedido a la sucursal más
cercana a la dirección del cliente. Uno de los cinco conductores (dos de los cuales solo trabajan a tiempo
parcial los fines de semana) entrega el pedido. El conjunto de datos captura la cantidad de pizzas
ordenadas, así como la factura final, que también puede incluir bebidas, ensaladas y platos de pasta. El
dueño del negocio observó un mayor número de quejas, principalmente porque las pizzas llegan
demasiado tarde y demasiado frías. Para mejorar la calidad del servicio de su negocio, el propietario
quiere medir (i) el tiempo desde la llamada hasta la entrega y (ii) la temperatura de la pizza a la llegada
(lo que se puede hacer con un dispositivo especial). Idealmente, una pizza llega dentro de los 30 minutos
posteriores a la llamada; si tardamásde40minutos, se promete a los clientes una botella de vino gratis
(aunque no siempre se entrega). La temperatura de la pizza debe estar por encima de los 65◦ en el
momento de la entrega. El análisis de los datos tiene como objetivo determinar los factores que influyen
en el tiempo de entrega y la temperatura de las pizzas.
a. Calcule la media, la mediana, el mínimo, el máximo, el primer cuartil y el tercer cuartil para todas las
variables cuantitativas.
b. Determineeinterpreteelpercentil99paraeltiempodeentregayla temperatura.
El 99% de las pizzas que se entregaron tenían una temperatura como máximo de 79,87 ºC