Está en la página 1de 12

INVESTIGACION DE OPERACIONES Página 1 de 12

TRABAJO FINAL ESTADISTICA INFERENCIAL

PROFESOR: MANUEL ALVARADO MARTINEZ

SUBGRUPO

KIMBERLY JAHANIA FERRARO QUIROZ-1821981420

YESID JAVIER BARRERA GUTIERREZ – 1821981010

MIRYAM ANDREA VARGAS GUTIERREZ – 1821981272

SHIRLEY ALEJANDRA MAZO MORA -1821982188

DIEGO ALEXANDER VELANDIA MOSALVE- 1721982363

INSTITUCION UNIVERSITARIA POLITECNICO GRANCOLOMBIANO

INGENIERIA INDUSTRIAL

COLOMBIA

2019
INVESTIGACION DE OPERACIONES Página 2 de 12

TABLA DE CONTENIDO

INTRODUCCIÓN ........................................................................................................................... 3
1. OBJETIVO PRINCIPAL ......................................................................................................... 4
2.1 OBJETIVOS SECUNDARIOS.................................................................................................. 4
2. PRESENTACIÓN DEL CASO ............................................................................................... 5
CONCLUSIONES ......................................................................................................................... 12
INVESTIGACION DE OPERACIONES Página 3 de 12

INTRODUCCIÓN

La Estadística Inferencial se centra en tomar una pequeña muestra representativa de la población y

a partir de ésta, infiere que el resto de la población tiene el mismo comportamiento.

En caso de que no sea factible realizar un estudio completo por cuestiones de tiempo, recursos o

costo, se puede calcular un tamaño de muestra para medir solo algunos elementos de la población,

posteriormente se infiere que el resto de la población se comporta igual que la muestra tomada.
INVESTIGACION DE OPERACIONES Página 4 de 12

1. OBJETIVO PRINCIPAL

Comprender el procedimiento para construir intervalo de confianza para estimar la diferencia de

dos promedios poblacionales e interpretarlo.

2.1 OBJETIVOS SECUNDARIOS

➢ Identifica variables constantes y parámetros, y las relaciones que pueden existir entre ellos

y su representación matemática.

➢ Desarrolla la estimación de parámetros mediante el uso de intervalos de confianza.


INVESTIGACION DE OPERACIONES Página 5 de 12

2. PRESENTACIÓN DEL CASO

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las


transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el
comportamiento de compra del cliente frente a diferentes productos. Específicamente, el problema
que estamos tratando de predecir la variable dependiente (el monto de la compra) con la ayuda de
la información contenida en las otras variables.

Las variables del archivo

User_ID Identificador único del comprador

Product_ID Identificador único del producto.

Gender Sexo del comprador

Age Edad del comprador dividida en contenedores

Occupation Ocupación del comprador.

City_Category Lugar de residencia del comprador.

Stay_In_Current_City_Years Número de años en la ciudad actual.

Marital_Status Estado civil del comprador

Product_Category_1 Categoría de producto de compra

Product_Category_2 El producto puede pertenecer a otra categoría

Product_Category_3 El producto puede pertenecer a otra categoría

Purchase Valor de la compra en dólares


INVESTIGACION DE OPERACIONES Página 6 de 12

Pregunta 1

1. Realice un histograma y explique la forma y la curtosis según el contexto.

clase frecuencia
1374 8149
2563 24026
3752 28957
4941 28280
6130 68558
7319 61551
8508 69588
9697 35033
10886 39737
12075 39433
13264 18846
14453 5967
15642 30227
16831 33727
18020 2071
19209 11484
20398 23404
21587 6223
22776 10
23965 2306

De acuerdo al contexto de los datos, se presenta una distribución de gran apuntamiento, se utiliza

el método de Fischer , dividiendo el resultado de la suma de los valores X-Promedio entre el

número total de datos (537577) por la desviación estandar de la potencia de 4, el resultado indica

un valor superior a 3, por lo tanto, se puede apreciar con respecto a la curtosis que es una

distribución leptocúrtica, existiendo una gran concentración de valores en torno a su media.


INVESTIGACION DE OPERACIONES Página 7 de 12

Pregunta 2
2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e

interprete los resultados.

Media 9333,85985

Error típico 6,79357121

Mediana 8062

Moda 6855

Desviación estándar 4981,02213

Varianza de la muestra 24810581,5

Curtosis -0,34312137

Coeficiente de asimetría 0,62427973

Rango 23776

Mínimo 185

Máximo 23961

Suma 5017668378

Cuenta 537577

4981
𝐶𝑉 = = 0,53 ∗ 100 = 53%
9333
El valor de compra purchase tiene como promedio un valor de 9.333, además el valor de la

mitad de las observaciones, es decir la mediana tiene un valor de 8.062, este valor indica que

el 50% de las compras fue por encima de 8.062 y el otro 50% fue por debajo de este valor; y

una moda de 6.855, esto indica que es el valor más frecuente o el que más se repite. El
INVESTIGACION DE OPERACIONES Página 8 de 12

coeficiente de variación es de 53% lo que quiere decir que la variabilidad se los datos no son

grande.

Pregunta 3
3. En relación a las variables dadas en la tabla anterior, responda y justifique los resultados:

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?

Rango
Suma
Edades

0-17 132.659.006
18-25 901.669.280
26-35 1.999.749.106
36-45 1.010.649.565
46-50 413.418.223
51-55 361.908.356
55+ 197.614.842

La categoría de edad que más realiza compras en el black-Friday son los que comprenden una

edad de 26 a 35 años de edad.

3.2 ¿Cuál es promedio de gastos de la categoría de la edad que más compra?

Rango
26-35
Edades
Promedio 9.315
INVESTIGACION DE OPERACIONES Página 9 de 12

El promedio de purchase en el rango de edad de 26 a 35 es de 9.315.

3.3 ¿La proporción de hombres que compran es mayor que la de mujeres?

Hombre 405.380

Mujer 132.197

Total 537.577

405.380
𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛 𝑑𝑒 ℎ𝑜𝑚𝑏𝑟𝑒𝑠 = = 0,754
537.577

La proporción de hombres que compran si es mayor que las mujeres. El 75,4% de estas compras
son de hombres.

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

Mujeres Hombres

8.810 9.505

El promedio de gasto de los hombres es de 8.810 y el de las mujeres es de 9.505


INVESTIGACION DE OPERACIONES Página 10 de 12

Pregunta 4
4. Intervalos de confianza

4.1 ¿Cuál es el tamaño de la muestra que se requiere? Si se exige un error al calcular la

media del 2% y un nivel de confianza del 95%

𝑵𝒁𝟐 𝒑𝒒
𝒏=
𝑬𝟐 (𝑵 − 𝟏) + 𝒁𝟐 𝒑𝒒

537.577(1,96)2 (0,5)(0,5)
𝑛= = 2.390
(0,02)2 (537.576) + 1,962 (0,5)(0,5)

El tamaño de muestra es de 2.390

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para

la diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.

Mujeres Hombres

promedio 8.810 9.505


desviación 4.721 5.051

𝝈𝟐𝟏 𝝈𝟐𝟐
𝒙𝟏 − 𝒙𝟐 ± 𝒁 ∝/𝟐√ +
𝒏𝟏 𝒏𝟐
INVESTIGACION DE OPERACIONES Página 11 de 12

4.7212 5.0512
9.505 − 8.810 ± 1,96√ +
132.197 405.380

695 ± 29.82
692 − 29.82 = 665.18 692 + 29.82 = 721.82

De acuerdo a lo anterior, intervalo de confianza para la diferencia de la media de los hombres y

mujeres en el gasto queda en un rango 665,18 y 721,82


INVESTIGACION DE OPERACIONES Página 12 de 12

CONCLUSIONES

Se desarrollo cada uno de los ejercicios propuestos en la actividad para la materia de estadística

inferencial, aplicando los diferentes tipos de formulaciones y conceptos de probabilidad obteniendo

resultados de confiabilidad racionales.

También podría gustarte