Está en la página 1de 4

Descripción

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las transacciones realizadas
en una tienda minorista. La tienda quiere conocer mejor el comportamiento de compra del cliente frente a
diferentes productos. Específicamente, el problema que estamos tratando de predecir la variable dependiente (el
monto de la compra) con la ayuda de la información contenida en las otras variables.

Las variables del archivo adjunto son las siguientes:

User_ID Identificador único del comprador

Product_ID Identificador único del producto.

Gender Sexo del comprador

Age Edad del comprador dividida en contenedores

Occupation Ocupación del comprador.

City_Category Lugar de residencia del comprador.

Stay_In_Current_City_Years Número de años en la ciudad actual.

Marital_Status Estado civil del comprador

Product_Category_1 Categoría de producto de compra

Product_Category_2 El producto puede pertenecer a otra categoría

Product_Category_3 El producto puede pertenecer a otra categoría

Purchase Valor de la compra en dólares

Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

1. Realice un histograma y explique la forma y la curtosis según el contexto.

n 537577,00
Mín 185,00
Máx 23961
el rango(R): R = Xmax– Xmin 23961-185=23776

• Número de intervalos. Aplicando la Regla de Sturges:


k = 1+ 3.322 log n =20,09
• Amplitud de los intervalos de clase.
R 23776
A= = =1188,8
K 20

Tabla de frecuencias
Variable Clase LI LS MC FA FR
Purchase 1 185,0 1373,8 779,40 8116 0,020
Purchase 2 1373,8 2562,6 1968,20 24059 0,040
Purchase 3 2562,6 3751,4 3157,00 28913 0,050
Purchase 4 3751,4 4940,2 4345,80 28324 0,050
Purchase 5 4940,2 6129,0 5534,60 68478 0,130
Purchase 6 6129,0 7317,8 6723,40 61631 0,110
Purchase 7 7317,8 8506,6 7912,20 69581 0,130
Purchase 8 8506,6 9695,4 9101,00 34863 0,060
Purchase 9 9695,4 10884,2 10289,80 39891 0,070
Purchase 10 10884,2 12073,0 11478,60 39347 0,070
Purchase 11 12073,0 13261,8 12667,40 18874 0,040
Purchase 12 13261,8 14450,6 13856,20 6047 0,010
Purchase 13 14450,6 15639,4 15045,00 30066 0,060
Purchase 14 15639,4 16828,2 16233,80 33862 0,060
Purchase 15 16828,2 18017,0 17422,60 2098 0,000
Purchase 16 18017,0 19205,8 18611,40 11339 0,020
Purchase 17 19205,8 20394,6 19800,20 23486 0,040
Purchase 18 20394,6 21583,4 20989,00 6286 0,010
Purchase 19 21583,4 22772,2 22177,80 10 0,000
Purchase 20 22772,2 23961,0 23366,60 2306 0,000

Chart Title
68478 69581
70000 61631

60000
50000 3989139347
34863 33862
40000 2891328324 30066
24059 23486
30000 18874
20000 11339
8116 6047 6286
10000 2098 10 2306
0
FA

2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los resultados.

Media 9333,86
D.E. 4981,02
CV 53,37
Mediana 8062,00
Kurtosis -0,34
En relación a la variables dadas en la tabla anterior, responda y justifique los resultados:

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?

edad f f re f%
0-17 14707 0,02735794 2,73579413
18-25 97634 0,18161863 18,1618633
26-35 214690 0,39936604 39,9366044
36-45 107499 0,19996949 19,9969493
46-50 44526 0,0828272 8,28272043
51-55 37618 0,06997695 6,99769521
55+ 20903 0,03888373 3,8883732
537577

f%
39.94

20
18.16

8.28
7
2.74 3.89

0-17 18-25 26-35 36-45 46-50 51-55 55+

3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más compra?

Aplicando la funcion (=PROMEDIO.SI.CONJUNTO(L2:L537578;D2:D537578;D198715)) a la hoja de calculo del


ejercicio elresultado es:
9314,6
3.3 ¿La proporción de hombres que compran es mayor que la de mujeres?

Usando la funcion (=CONTAR.SI(datos!C2:C537578;datos!C4) para el conteo de los hombres y


(=CONTAR.SI(datos!C2:C537578;datos!C3) para las mujers
frecuenci
  a fr re fr %
hombre
s 405380 0,7541 75,409
mujeres 132197 0,2459 24,591
  537577    
Vemos que el % de hombres es 75.4% pocom,as de 3 veces el de la mujer

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

promedi
o
hombres   9504,771713
promedi
o
mujeres   8809,761349

Intervalos de confianza

4.1 ¿Cuál es el tamaño de la muestra que se requiere?. Si se exige un error relativo del 2% y un nivel de
confianza del 95%

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los
gastos para los hombres y mujeres e interprete el resultado obtenido.

Importante: En el Foro: Desarrollo del trabajo colaborativo. se debe evidenciar el borrador de cada uno de los
anteriores interrogantes.

Consolidar la información en un archivo PDF y con soporte de un archivo en excel, el cual debe ser subido en el
Foro: Desarrollo del trabajo colaborativo. Este PDF debe tener (portada, objetivos, desarrollo de la actividad,
resultados y referencias), el excel los cálculos y procedimientos.

Bibliografía
Dagdoug, M. (10 de Julio de 2019). Black Friday Sales: Analysis an Prediction. Obtenido de Kaggle:
https://www.kaggle.com/mehdidag/black-friday

También podría gustarte