Está en la página 1de 4

TRABAJO EN GRUPO

Descripción
Esta actividad permite al estudiante hallar las respuestas a situaciones frecuentes
que se presentan durante el manejo de los datos, aplicando los conceptos tratados
en el módulo y desarrollando las competencias de interpretación de los resultados
obtenidos.

Alistamiento de los datos


Nombre del Taller
Dar respuesta a todos los requerimientos solicitados,
Objetivo de
presentando evidencias de la utilización de la herramienta R.
aprendizaje del Taller
El estudiante estará en la capacidad de comprender el alcance
Competencias que tienen los datos que se le están entregando, utilizándolos
metodológicas como recurso para dar respuesta a los requerimientos
presentados.

Criterios de Presentar evidencia de las operaciones realizadas, según el


evaluación enunciado de cada situación.

ü Entregar las evidencias dentro de los plazos definidos.


Instrucciones para el ü Dar respuesta correcta a las consultas propuestas
desarrollo del utilizando los registros suministrados.
proyecto ü Hacer entrega de los archivos solicitados y elaborar un
documento Word con las imágenes requeridas.

Indicador Ponderación
Respuesta a la solicitud que utiliza el 20%
archivo Superstore
Resultados del Atiende la consulta que usa el archivo 20%
Desempeño SFCrime
Ofrece respuesta al cuestionamiento que 20%
utiliza el archivo HealthData
Presentación de la respuesta a la inquietud 20%
que usa el archivo DataExercise
Presentación organizada del documento 20%
word y las evidencias de los cálculos
Total 100%

1
DESCRIPCIÓN DEL PROYECTO A DESARROLLAR

Usar únicamente RStudio, complete los siguientes requerimientos.

1. En el archivo Superstore.csv se encuentra la información transaccional de una


multinacional para un conjunto seleccionado de productos que se venden en
múltiples países. Dentro de los campos se encuentra el identificador de cada
producto, categoría, fecha de venta, fecha de envío, lugar de venta, valor de la venta,
cantidad de productos vendidos, valor del envío, entre otros. Con la información
brindada deberá realizar los siguientes requerimientos:

1.1 Revisa que la información esté completa: encontrar cuántos valores faltantes o
vacíos hay en cada columna de los datos entregados.
1.2 Calcular el precio cobrado al cliente: dentro de los datos se encuentra el valor de
venta (Sales) y el valor de envío (Shipping.Cost), así que deberá crear una
columna nueva (Total.Sale) con la suma de estos dos valores.
1.3 Calcular el precio de cada unidad vendida: dentro de los datos se encuentra el
valor de la venta y la cantidad de productos vendidos (Quantity). Calcule el valor
individual del producto (Unit.Price).
1.4 Calcular la relación Costo de Envío y Precio cobrado al cliente: este valor es
calculado como costo del envío (Shipping.Cost) dividido por el precio cobrado al
cliente (Total.Sale calculado en 1.2).
1.5 Valor venta para alcanzar equilibrio en ventas con pérdidas: hay diversas ventas
que se efectuaron a pérdidas (Profit negativos), así que, deberá crear un campo
de valor sugerido de venta (Suggested.Sales) y en este campo calcular el valor
que debería haber tenido la venta para tener un valor de equilibrio (Profit = 0).
Este cálculo SOLO se efectúa en las transacciones que tuvieron un margen de
ganancia negativo, para todas las demás transacciones el valor
(Suggested.Sales) debe ser 0.
1.6 Valor sugerido de productos: utilizando la columna de valor sugerido de venta
(Suggested.Sales, obtenido en 1.5) deberá calcular un precio aconsejado para el
producto vendido (Suggested.Unit.Price), este cálculo se realiza de manera
similar al 1.3.

Evidencia de ejercicio completado:


Deberá entregar un archivo de Word en donde se escriba el código que utilizó para
realizar cada requerimiento (incluyendo la carga del archivo CSV). Además, deberá
exportar los datos obtenidos en un archivo CSV final llamado
“Superstore_Complete.csv”.

2
2. En el archivo SFCrime.csv se encuentra la información transaccional de crímenes en
distintos distritos. En este archivo encontramos fechas, categorías, lugares, entre
otros. Con la información brindada deberá realizar los siguientes requerimientos:

2.1 ¿Qué día de la semana se cometen más crímenes? Esto se responderá usando
una gráfica circular (o torta), en donde se observen los nombres de los días
(DayofWeek) junto con el porcentaje y total de crímenes de cada día.
2.2 ¿Cuál es el crimen que más se comete ese día? Este resultado también se
realizará con una gráfica circular, excepto que solo se mostrarán los crímenes
(Category) que superen 200 registros en este día. En la gráfica circular se debe
observar el porcentaje y total de crímenes para cada tipo de crimen.
2.3 Hallar el top 5 de crímenes por cada distrito. Este resultado se puede mostrar en
múltiples tablas (una por Distrito).

Evidencia de ejercicio completado:


Deberá entregar un archivo de Word en donde se escriba el código que utilizó para
realizar cada requerimiento (incluyendo la carga del archivo CSV), además deberá
anexar en este archivo las figuras y tablas pedidas.

3. En el archivo HealthData.csv se encuentra la información de salubridad por Estados.


Entre los datos tenemos el total de población, porcentaje de mujeres, porcentaje de
diabetes, promedio de ingreso por hogar, entre otros. Con la información brindada
deberá realizar los siguientes requerimientos:

3.1 Arregle el nombre de las columnas a un nombre más adecuado: por ejemplo, la
columna “<18” en R queda como “X..18”, así que puede cambiar el nombre a algo
como “Menores.de.18”. Realice este paso con cualquier columna cuyo nombre
no sea claro.
3.2 Realice una regresión lineal entre Porcentaje de Diabetes e Inactividad Física:
esta regresión lineal debe ser mostrada en una gráfica de dispersión entre estas
dos variables con una línea recta (de la regresión) cruzando esta gráfica (similar
como se muestra en la cartilla).
3.3 Use el modelo de regresión lineal para predecir un valor futuro. Con el modelo
obtenido en 3.2, pronostique el porcentaje de diabetes que tendría un Estado con
un valor de inactividad física de 31.

Evidencia de ejercicio completado:


Deberá entregar un archivo de Word en donde se escriba el código que utilizó para
realizar cada requerimiento (incluyendo la carga del archivo CSV), además deberá
anexar en este archivo las figuras pedidas.

3
4. En el archivo DataExercise.csv se encuentra la información de un subconjunto de
personas de una ciudad. Entre los datos tenemos la edad, el nivel educativo,
ingresos, género, entre otros. Con la información brindada deberá realizar los
siguientes requerimientos:

4.1 Separar la población en número de hijos. Para esto creará una variable por
distinta por cada grupo (Ej: Pob.Hijos.0 para las personas que no tienen hijos,
Pob.Hijos.1 para las personas que tiene solo 1 hijo y así sucesivamente).
4.2 Generar un histograma del Peso del individuo por grupo. Creará un histograma
por cada grupo creado en el 4.1. Se crearán 12 rangos en el histograma, que van
desde el valor mínimo de peso de la población global (no del grupo) hasta el valor
máximo de peso de la población global.
4.3 Explicar qué comportamientos se observa en cada histograma, si lo hay.

Evidencia de ejercicio completado:


Deberá entregar un archivo de Word en donde se escriba el código que utilizó para
realizar cada requerimiento (incluyendo la carga del archivo CSV), además deberá
anexar en este archivo las figuras y la explicación pedida.

También podría gustarte