Está en la página 1de 3

En el siguiente trabajo, cada estudiante debe contribuir a la solución de los ejercicios planteados y esta

se debe evidenciar en una participación activa dentro de cada una de las semanas 3, 4 y 5.

● La evaluación de su participación semanal se basará en la siguiente rúbrica: ​http://bit.ly/2F1s9Cx

● La evaluación del consolidado del ​Trabajo final ​se basará en la siguiente rúbrica: ​http://bit.ly/2tYeciq

Tenga presente que para cada uno de los ejercicios debe ser explícito con la solución que obtiene, son
necesarios procedimientos.

Competencia
● Identifica variables constantes y parámetros, y las relaciones que pueden existir entre ellos y su
representación matemática.
● Desarrolla la estimación de parámetros mediante el uso de intervalos de confianza.

Objetivo
Comprender el procedimiento para construir intervalo de confianza para estimar la diferencia de dos promedios
poblacionales e interpretarlo.

Descripción
El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las transacciones realizadas
en una tienda minorista. La tienda quiere conocer mejor el comportamiento de compra del cliente frente a
diferentes productos. Específicamente, el problema que estamos tratando de predecir la variable dependiente (el
monto de la compra) con la ayuda de la información contenida en las otras variables.

Las variables del archivo adjunto son las siguientes:

User_ID Identificador único del comprador

Product_ID Identificador único del producto.

Gender Sexo del comprador

Age Edad del comprador dividida en contenedores

Occupation Ocupación del comprador.


City_Category Lugar de residencia del comprador.

Stay_In_Current_City_Years Número de años en la ciudad actual.

Marital_Status Estado civil del comprador

Product_Category_1 Categoría de producto de compra

Product_Category_2 El producto puede pertenecer a otra categoría

Product_Category_3 El producto puede pertenecer a otra categoría

Purchase Valor de la compra en dólares

En el siguiente link podrá descargar el archivo: ​http://bit.ly/2M8AZmG

Por lo anterior se sugiere que realice la siguiente:

Utilizando la variable del valor de la compra (​Purchase​), realice lo siguiente:

1. Realice un histograma y explique la forma y la curtosis según el contexto.


2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los resultados.

En relación a la variables dadas en la tabla anterior, responda y justifique los resultados:

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?


3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más compra?
3.3 ¿La proporción de hombres que compran es mayor que la de mujeres?
3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

Intervalos de confianza

4.1 Proponga una alternativa para determinar el tamaño de una muestra para la variable compra (Purchase).

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los
gastos para los hombres y mujeres e interprete el resultado obtenido.

Importante: ​En el ​Foro: Desarrollo del trabajo colaborativo​. se debe evidenciar el borrador de cada uno de los
anteriores interrogantes.

Consolidar la información en un archivo PDF y con soporte de un archivo en excel, el cual debe ser subido en el
Foro: Desarrollo del trabajo colaborativo​. Este PDF debe tener (portada, objetivos, desarrollo de la actividad,
resultados y referencias), el excel los cálculos y procedimientos.

Bibliografía
Dagdoug, M. (10 de Julio de 2019). Black Friday Sales: Analysis an Prediction. Obtenido de Kaggle:
https://www.kaggle.com/mehdidag/black-friday

También podría gustarte