Está en la página 1de 10

ASIGNATURA

ESTADÍSTICA INFERENCIAL

PARTICIPANTES

AGUIAR SOTO STIVEN


CUEVAS MAHECHA JAVIER
BENAVIDES PENA IVAN DAVID

PROGRAMA

INGENIERÍA INDUSTRIAL

UNIVERSIDAD

POLITÉCNICO GRAN COLOMBIANO


AÑO 2019
CONTENIDO
0. INTRODUCCIÓN ........................................................................................................ 3
1. OBJETIVOS................................................................................................................ 4
1.1. OBJETIVO GENERAL 4
1.2. OBJETIVOS ESPECÍFICOS ....................................................................................................................... 4

2. BASE DE DATOS…………………................................................................................................................... 5

5. CONCLUSIÓN…………………….. .............................................................................................. 11
0. INTRODUCCIÓN

A partir de la estadística y su sistema de obtención de información de un conjunto de datos permite


identificar y solucionar por medio de la probabilidad respuesta a nivel social económico o
empresarial sobre un sinfín de datos que deben ser analizados a partir de utilizar las metodologías
estadísticas como la media, mediana o desviación estándar.

Con la estadística permite tomar decisiones respecta a la muestra de una población y desde estos
resultados representar gráficamente un enfoque más claro a la realidad según la muestra inicial de la
población consultada, esto para reducir probabilidades que puedan llegar tener este tipo de
población según sea el objetivo.
1. OBJETIVOS

1.1. OBJETIVO GENERAL

Comprender el procedimiento para construir intervalo de confianza para estimar


la diferencia de dos promedios poblacionales e interpretarlo.

1.2. OBJETIVOS ESPECÍFICOS

 Interpretar e identificar los procesos para determinar la moda mediana y desviación estándar

 Conocer las diferentes formas de hallar un promedio de un conjunto de datos según los
requerimientos que se soliciten.
2. BASE DE DATOS

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las


transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el comportamiento
de compra del cliente frente a diferentes productos. Específicamente, el problema que estamos
tratando de predecir la variable dependiente (el monto de la compra) con la ayuda de la información
contenida en las otras variables.

Las variables del archivo adjunto son las siguientes:

User_ID
Identificador único del comprador
Product_ID
Identificador único del producto.
Gender
Sexo del comprador
Age
Edad del comprador dividida en contenedores
Occupation
Ocupación del comprador.
City_Category
Lugar de residencia del comprador.
Stay_In_Current_City_Years
Número de años en la ciudad actual.
Marital_Status
Estado civil del comprador
Product_Category_1
Categoría de producto de compra
Product_Category_2
El producto puede pertenecer a otra categoría
Product_Category_3
El producto puede pertenecer a otra categoría
Purchase
Valor de la compra en dólares
3. Realice un histograma y explique la forma y la curtosis según el contexto.

Se tomaron los datos de la edad, ya que para permitir generar la información se solicita agrupar la
mayor cantidad de datos para determinar el apuntamiento.

Curtosis

Se determina que para este histograma, la curtosis es Platicurtica, ya que la formula nos indica que
es inferior a 3, generando el valor de 1.99

4. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los
resultados.

La Media se obtiene sumando el total de las ventas en dólares ( 5.017.668.378) con la función suma
y dividiéndolo en el numero de individuos de la tabla (537.577).

Media = 9.333,86 redondeando a 2 cifras

La Mediana la obtenemos organizando el listado de menor a mayor (ponemos un filtro) y ubicamos


exactamente el dato que se sitúa en el ombligo o el centro o se a el dato que queda en la fila #
(268.789)

Mediana = 8.062
La Moda es el dato que mas se repite, para ello copiamos la columna de precio en una hoja nueva
nos asistimos con la herramienta quitar duplicados y luego usamos la formula “=contar.si” para
determinar cuantas veces aparece cada uno de los valores en la tabla original. Por último filtramos
los resultados de mayor a menor.

Moda = 3.460 con un total de 94 repeticiones

 En relación a la variables dadas en la tabla anterior, responda y justifique los resultados:

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?

LA CATEGORÍA QUE MAS CONSUME ES LA DE 26-35 CON UN TOTAL DE 214.690

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?

en el caso de las edades se tiene que la edades que hacen mayor compra en la tienda estan 26 - 35

3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más compra?

con un promedio de 9334

3.3 ¿La proporción de hombres que compran es mayor que la de mujeres?


los hombres compran mas en un 75% que las mujeres con un 25%

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

PROMEDIO = TOTAL COMPRAS HOMBRE / # TRANSACCIONES

PROMEDIO HOMBRES = 3.853.044.357 / 405.380 = 9.504,8

PROMEDIO = TOTAL COMPRAS MUJERES / # TRANSACCIONES

PROMEDIO MUJERES = 1.164.624.021 / 132.197 = 8.809,8

4.1 ¿Cuál es el tamañ o de la muestra que se requiere?. Si se exige un error relativo del 2% y un nivel
de confianza del 95%

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la
diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.
5. CONCLUSIÓN

Se desarrolló el proceso de intervalos en el desarrollo del trabajo con el fin de obtener los datos
solicitados e interpretarlos por medio de gráficas, y métodos estadísticos a partir de la base de datos
los cuales permitieron conocer un población y determinar el tamaño de la muestra para el desarrollo
y obtención de los datos como el promedio, media, desviación estándar y nivel de confianza.

Se determinó que para el intervalo de confianza se obtiene a partir de un valores de los cuales se
encuentra el valor buscado por medio de probabilidad.

También podría gustarte