Está en la página 1de 10

FACULTAD DE INGENIERÍA Y

CIENCIAS BÁSICAS

PROYECTO GRUPAL Institución Universitaria Politécnico Grancolombiano

ESTADISTICA INFERENCIAL

GRUPO 2:

JULIAN DARIO SILVA PIEDRAITA COD:1911981466

INSTRUCTOR: ALEXANDER TRILLERAS

INSTITUCION UNIVERSITARIA POLITECNICO

GRANCOLOMBIANO

2020
CONTENIDO

1. INTRODUCCION ________________________________________ 2

1.1 OBJETIVO PRINCIPAL ___________________________________ 3

1.2 OBJETIVO SECUNDARIO ________________________________ 4

2 DESARROLLO __________________________________________ 5

2.1

3.
INTRODUCCION

La estadística inferencia es una materia donde se puede derivar de la probabilidad


de resolución de problemas puntuales o las matemáticas. esto favorece a la
solución de dificultades de una población mediante características cuantitativas y
cualitativas a nivel cotidiano donde se nos presenta en la vida diaria

con la inferencia podemos llegar a puntos objetivos, metas y cifras puntuales


destinados a informar acerca de un comportamiento de una población mediante la
extracción de una muestra para posteriormente analizarla
OBJETIVO PRINCIPAL

Comprender el procedimiento para construir intervalo de confianza para estimar la


diferencia de dos promedios poblacionales e interpretarlos.

OBJETIVO SECUNDARIO
Competencia

Identifica variables constantes y parámetros, y las relaciones que pueden existir


entre ellos y su representación matemática.

Desarrolla la estimación de parámetros mediante el uso de intervalos de


confianza.

Objetivo

Comprender  el procedimiento para construir intervalo de confianza para estimar


la  diferencia de dos promedios poblacionales e interpretarlo.

Descripción

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra


de las transacciones realizadas en una tienda minorista. La tienda quiere conocer
mejor el comportamiento de compra del cliente frente a diferentes productos.
Específicamente, el problema que estamos tratando de predecir la variable
dependiente (el monto de la compra) con la ayuda de la información contenida en
las otras variables.

 Las variables del archivo adjunto son las siguientes: 

User_ID Identificador único del comprador

Product_ID Identificador único del producto. 

Gender Sexo del comprador

Edad del comprador dividida en


Age
contenedores

Occupation Ocupación del comprador.

City_Category Lugar de residencia del comprador.


Stay_In_Current_City_Years Número de años en la ciudad actual.

Marital_Status Estado civil del comprador

Product_Category_1 Categoría de producto de compra

El producto puede pertenecer a otra


Product_Category_2
categoría

El producto puede pertenecer a otra


Product_Category_3
categoría

Purchase Valor de la compra en dólares

1. Utilizando la variable del valor de la compra (Purchase), realice lo


siguiente:
Realice un histograma y explique la forma y la curtosis según el contexto. 
                                     Que es un Histograma
Es aquella representación gráfica de estadísticas de diferentes tipos, la utilidad del
histograma tiene que ver con la posibilidad de establecer de manera visual,
ordenada y fácilmente comprensible todos los datos numéricos estadísticos que
pueden tornarse difíciles de entender.
El histograma representa una gran dispersión  de datos por lo que los datos
pueden variar aun así se pueden apreciar los valores mas relativos
Explicando el histograma podemos decir que las mayores compras se realizaron
en valores menores a 10.000 mil USD , que la curvatura del histograma es
negativa 
la curtosis se puede definir como apuntada o leptocurtica
Debido a que la curtosis es una medida de altura de la curva su cálculo se efectúa
en función de la desviación estándar y de los momentos unidimensionales de
cuarto orden con respecto a la media

Ap=m4S4
Para calcular el grado de apuntamiento de la distribución:
de  537577   Datos
La Curtosis es: -0.34312137 
2.

MODA 6,855.00

MEDIA 8,062.00

DESVIACIÓN ESTÁNDAR 4,981.02


VARIANZA 24,810,535.33
CV 0.62
C.A 0.62

 En la tabla de frecuencias podemos decir que el valor promedio de los


gastos en blackfriday es de $ 8.062
 Los datos están dispersos aproximadamente  4,981.02 con respecto a la
media.
 La dispersión podemos decir que es de un 62% entonces que esta muestra
no puede ser muy adecuada y que los datos no pueden ser muy convenientes. 

3.1 ¿Cuál es la categoría de edades que más realiza compras en Black-Friday?

Edades Promedio gasto - compras


26-35 214.690
36-45 107.499
18-25 97.634
46-50 44.526
0-17 14.707
55+ 20.903
51-57 37.618

Total = 537.577
3.2 ¿Cuál es el promedio de gastos de la categoría de la edad que más compra?
Compradores 26 - 35 años = 214.690
Valor total comprado por este grupo= 1.999.749.106
1.999.749.106 / 214.690= 9.314,58
La respuesta es 9.314,58 
 
3.3 ¿La proporción de hombres que compra es mayor que la de mujeres?
Rta: si la proporción de hombres es mayor que la de mujeres ya que:
Hombres = 405.380
Mujeres= 132.197
3.4 ¿Cuál es el promedio de gastos de hombres y cual el de mujeres?
 
Rta: El promedio de gastos de los hombres es: 9.504,77
         El promedio de gastos de las mujeres es: 8.809,76

4.1 ¿Cuál es el tamaño de la muestra que se requiere?


Vamos a utilizar esta tabla como referencia 

Promedio de gastos Base de datos


Mujeres 8809.7613
Hombres 9504.7717
Varianza hombres 25513179.4
varianza mujeres 22291996.2
desviación hombres  5051.0572
desviación mujeres 4721.4400
N.M 132197
N.H 405380

Entonces el nivel de confianza. Podemos interpretar que del 95% este sería el
resultado que se lograra construir entre hombres y mujeres. Podemos sacar o
utilizar esta fórmula:
El resultado del tamaño de la muestra, para la variable que determinamos.
4.2 Asumiendo que los gastos son normales, calcule un intervalo de confianza al
95% para la diferencia de los gastos para los hombres y mujeres e interprete el
resultado obtenido.
Se realiza por medio de la siguiente formula:

También podría gustarte