Está en la página 1de 5

OBJETIVOS

Objetivo General

 Analizar, desarrollar y determinar la media, la mediana, la moda, la desviación estándar,

el coeficiente de variación e interpretar los resultados.

Objetivos Específicos

 Analizar el histograma de la base de datos “Black Friday” e interpretar la curtosis de

este, según el contexto.

 Determinar la media, mediana, moda, desviación estándar, coeficiente de variación e

interpretar los resultados.

 Desarrollar las preguntas en la rúbrica donde se pregunta la categoría de edades que más

realiza compras, el promedio de gastos, etc.

1
JUSTIFICACIÓN

El presente trabajo se enfocará en estudiar la distribución normal a través del estudio de

la base de datos Black Friday para así determinar la relación que poseen algunas variables,

hallando o encontrando así las medidas de tendencia central comunes y de dispersión de datos,

en beneficio de los hombres o mujeres que pertenecen a esta base y analizar la proporción de

hombres o mujeres que realizaron compras en este día de ofertas. También, se desea determinar

el gasto por cada uno y la proporción muestral que requeríria para así hacer otros tipos de

inferencia a través de esta muestra, además de analizar el intervalo de confianza para la

diferencia de media entre hombres y mujeres.

2
DESARROLLO

1. ¿Cuál es el tamaño de la muestra que se requiere? Si se exige un error relativo del 2% y

un nivel de confianza del 95%.

Debido a que se trata de un error relativo del 2%, de la población suponemos, se hará con

la distribución Z para hallar el tamaño de la muestra proporcional de una población, también

conocida como distribución binomial. Para esto, se usarán 2 ecuaciones: la de margen de error y

la del tamaño de la muestra de la proporción de la población.

x 132197
p= = =0.2459
N 537577

q=1− p=1−0.2459=0.7541

1.96 2
n=0.2459 0.7541
( ) ( )
0.02
=1780.900357

Por lo tanto, se obtiene que la muestra para esta población, en términos de proporción es

de un total de 1781 individuos, si aproximamos al siguiente decimal. Sin embargo, presenta

irregularidades el ejercicio ya que el error se encuentra en un valor de 2% cuando debería ser de

5%, si el nivel de confianza es de 95%, para completar así el 100% de los datos.

3
2. Asumiendo que los datos son normales, calcule un intervalo de confianza al 95% para la

diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.

8809,7613
Promedio
5 Mujeres
9504,7717 695,01036 Diferenci
Promedio
1 Hombres 4 a

Desv
4721,4222
Stndr 132197 N2
5051,0510 Desv

3 Stndr 405380 N1

( 405380−1 ) 5051.052+(132197−1) 4721.422


(9504.78−8809.76)± 1.96
√ (405380+132197−2) √1
+
1
405380 132197

 695.02 ±1.96∗(15.74745493)

 695.02 ±30.86501166

 [664.1549 ~ 725.8850]

Se usa la distribución t de Student por dos motivos. La primera es porque se desconoce la

desviación estándar de la población y la segunda es cuando se supera un cierto número de datos

para cambiar entre la distribución Z normal y la t. Con un 95% de confianza, escogiendo dos

4
datos aleatorios al azar de hombre y mujer se espera que la diferencia se encuentre dentro de esta

diferencia de intervalo de confianza.

También podría gustarte