Está en la página 1de 9

PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

PROPUESTA INFERENCIAL

Integrantes:

Julian Andre Rua Garcia Cod: 1811020702


Pablo Andres Sarmiento Olarte Cod: 1811023009
Edison Ferley Telles Gallegos Cod 1721026323

ESTADISTICA INFERENCIAL
BOGOTÁ
2019
PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

OBJETIVO PRINCIPAL

Comprender  el procedimiento para construir intervalo de confianza para


estimar la  diferencia de dos promedios poblacionales e interpretarlo.

Descripción

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una


muestra de las transacciones realizadas en una tienda minorista. La tienda
quiere conocer mejor el comportamiento de compra del cliente frente a
diferentes productos. Específicamente, el problema que estamos tratando de
predecir la variable dependiente (el monto de la compra) con la ayuda de la
información contenida en las otras variables.

User_ID Identificador único del comprador

Product_ID Identificador único del producto. 

Gender Sexo del comprador

Age Edad del comprador dividida en contenedores

Occupation Ocupación del comprador.

City_Category Lugar de residencia del comprador.

Stay_In_Current_City_Year Número de años en la ciudad actual.


s

Marital_Status Estado civil del comprador

Product_Category_1 Categoría de producto de compra

Product_Category_2 El producto puede pertenecer a otra categoría


PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

Product_Category_3 El producto puede pertenecer a otra categoría

Purchase Valor de la compra en dólares

Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

1. Realice un histograma y explique la forma y la curtosis según el contexto.

De acuerdo al histograma se evidencia una curva leptocurtica (la Curtosis


>0) la cual representa en decaimiento hacia ambos costados de la media,
en este caso nueve ptos adicional de acuerdo al histograma también
podemos determinar lo siguiente.
 Se divide en siete clases.
 La clase que tiene mayor frecuencia es la edad de 26-35
 Tiene una frecuencia de 2.000.000 dólares en compras
PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de


variación e intérprete los resultados.

Media $ 9.275
Mediana $ 8.045
Moda $ 6.855
Desviación estándar $ 4.951
Coeficiente de
variación 0,53

En relación a las variables dadas en la tabla anterior, responda y justifique


los resultados:
3.1. ¿Cuál es la categoría de edades que más realiza compras en el black-
friday?

Rango de edad Gastos por edad


$
0-17 132.659.006
$
18-25 901.669.280
$
26-35 1.999.749.106
$
36-45 1.010.649.565
$
46-50 413.418.223
$
51-55 361.908.356
$
55+ 197.614.842
PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

La categoría de edad que mas compra realiza durante el black-Friday es la


de 26-35 años, con un valor de $ 1.999.749.106

3.2. ¿Cuál es promedio de gatos de la categoría de la edad que más compra?


Edad Promedio de gastos
$
0-17 9.020
$
18-25 9.235
$
26-35 9.315
$
36-45 9.401
$
46-50 9.285
$
51-55 9.621
$
55+ 9.454

El promedio de gastos para la categoría de edad 26-35 años que mas


compra es de $9,315

3.3. ¿La proporción de hombres que compran es mayor que la de mujeres?

Cantidad de hombres que


compran 405.380
Cantidad de mujeres que
compran 132.197

Total de compradores 537.577


PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

Grafica proporción de compras

Realizando el análisis de la información identificamos que los hombres


realizaron mayores compras que las mujeres, con un número de compras
de 405.380 para los hombres y 132.197 para las mujeres.

3.4. ¿Cuánto es el promedio de gasto de los hombres y las mujeres?


Gastos por genero Promedio de gastos
$
Gasto de mujeres 8.810
$
Gasto de hombres 9.505
PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

Grafica promedio de gastos


El promedio de gastos mas alto fue para los hombres con un valor de $
9.505 y para las mujeres fue de $ 8.810.
4.1. ¿ Cuál es el tamaño de la muestra que se requiere?. Si se exige un error
relativo del  2% y un nivel de confianza del 95%

Fórmula
n=NZ²pq
(N-1)E²+Z²pq
N 537577  
Z 1,96 3,8416
n=NZ²pq
p 0,5
q 0,5
51628
537577*3,8416*0,5*0,5 9    
(N-1) 537576  
E 0,02 0,0004
(N-1)E²+Z²pq Z 1,96 3,8416
p 0,5
q 0,5
537576*0,0004+3,8416*0,5*0,5 216,0    
Tamaño de la
371728/216 2390 muestra
PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

Realizando el análisis para determinar el tamaño de la muestra que se


requiere es de 2390

4.2. Asumiendo que los datos son normales, calcule un Intervalo de confianza
al 95% para la diferencia de los gastos para los hombres y mujeres e
interprete el resultado obtenido.

405.380 total hombres

132.197 Total mujeres


$
9.505 Media gastos hombres
$
8.810 Media gastos mujeres
$
5.051 Desviación estándar Hombres
$
4.721 Desviación estándar mujeres
7,9 Error de media hombres
12,98 Error de media mujeres
2,33 Z media Hombres
2,33 Z media Mujeres
18,48 Error de las muestra hombres
30,25 Error de las muestra mujeres

9523,2
Intervalo medio hombres 9486,29 - 6
8840,0
Intervalo medio mujeres 8779,51 - 2
PROYECTO GRUPAL

Institución Universitaria Politécnico Grancolombiano

Diferencia de media entre


695
hombres y mujeres
Error de la diferencia de las
168,61
medias muéstrales
E 329
Z 1,95

Intervalo de resultados 366 - 1024

También podría gustarte