Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Yeimy L. Londoño cod. 1821026820, Jhon J. Escobar Rojas cod. 1821025586, Jhon W.
Tabla de contenido
1. Introducción ................................................................................................................ 5
2. Objetivos ..................................................................................................................... 6
contexto. 7
3.3.1. Pregunta 3.1 ¿Cuál es la categoría de edades que más realiza compras en el
black-friday? .................................................................................................................... 13
3.3.2. Pregunta 3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más
compra? ………………………………………………………………………………14
3.3.3. Pregunta 3.3 ¿La proporción de hombres que compran es mayor que la de
mujeres? ………………………………………………………………………………15
3.3.4. Pregunta 3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?
………………………………………………………………………………16
3.4.1. Pregunta 4.1 Proponga una alternativa para determinar el tamaño de una
3.4.2. Pregunta 4.2 Asumiendo que los datos son normales, calcule un Intervalo de
confianza al 95% para la diferencia de los gastos para los hombres y mujeres e interprete
TABLA DE ILUSTRACIONES
Excel. ....................................................................................................................................... 12
Ilustración 7. Gráfico de rangos de edades con mayores compras en el Black Friday ....... 14
1. Introducción
El presente trabajo tiene como premisa, el que los estudiantes que integran el grupo 7, logren
una comprensión integral del procedimiento para que puedan construir, ya sea en su vida
laboral o académica, intervalos de confianza que les permitan estimar la diferencia de dos
Cabe anotar, que se hará uso de un caso de estudio, el cual les permitirá afianzar varias
habilidades necesarias en su vida post universidad, en la cual será un hecho que deberán
desenvolverse con un amplio dominio del trabajo colaborativo; por otro lado, para nadie es un
2. Objetivos
● Identificar las variables, constantes y parámetros, y las relaciones que pueden existir
entre ellos y su representación matemática.
● Desarrollar la estimación de parámetros mediante el uso de intervalos de confianza.
7
contexto.
insumo para desarrollar de forma más organizada y metódica el histograma relacionado con
la variable "Purchase".
NOTA. Cabe aclarar, que la estadística sugiere que cuando hay una gran cantidad de
datos, como es el caso del presente ejercicio, se agrupen los datos en clases y se realice una
sea inferior a 5 ni superior a 12, y por términos generales la cantidad de intervalos se puede
determinar por condiciones propias del problema a estudiar o en su defecto por la fórmula de
8
"Sturges" el cuál es un método Empírico para determinar el número de clases que deben
INTERVALO
INTERVALO FRECUENCIA
DE CLASE FRECUENCIA
MARCA DE CLASE FRECUENCIA RELATIVA
ABSOLUTA
ABSOLUTA RELATIVA
i LimInf LimSup ACUMULADA ACUMULADA
x ni hi Ni Hi
1 179 1430 804,5 9903 1,84% 9903 1,84%
2 1431 2682 2056,5 22355 4,16% 32258 6,00%
3 2683 3934 3308,5 33686 6,27% 65944 12,27%
4 3935 5186 4560,5 29078 5,41% 95022 17,68%
5 5187 6438 5812,5 69668 12,96% 164690 30,64%
6 6439 7690 7064,5 60750 11,30% 225440 41,94%
7 7691 8942 8316,5 96138 17,88% 321578 59,82%
8 8943 10194 9568,5 37442 6,96% 359020 66,78%
9 10195 11446 10820,5 11773 2,19% 370793 68,97%
10 11447 12698 12072,5 41540 7,73% 412333 76,70%
11 12699 13950 13324,5 15321 2,85% 427654 79,55%
12 13951 15202 14576,5 3905 0,73% 431559 80,28%
13 15203 16454 15828,5 54921 10,22% 486480 90,49%
14 16455 17706 17080,5 7670 1,43% 494150 91,92%
15 17707 18958 18332,5 1739 0,32% 495889 92,25%
16 18959 20210 19584,5 30914 5,75% 526803 98,00%
17 20211 21462 20836,5 8238 1,53% 535041 99,53%
18 21463 22714 22088,5 227 0,04% 535268 99,57%
19 22715 23966 23340,5 2309 0,43% 537577 100,00%
537577 100%
solicitado, haciendo uso del comando insertar Gráfico de Excel y graficando las columnas de
Es importante precisar que dicha gráfica representa marca de clase contra frecuencia
absoluta.
que se llama análisis de datos de Excel, que sirve para hacer histogramas y calcular valores
La curtosis es un parámetro que nos dice que tan alargada o achatada esta una distribución
comparada respecto a la distribución normal. Para este caso del gráfico se puede ver que la
curtosis está más achatada que la distribución normal y esto concuerda con el valor obtenido
para esta gráfica el cual es de (curtosis= -0.34) y es menor a 0. Una curtosis de este tipo nos
lo cual nos indica que la CURTOSIS DE LOS DATOS AGRUPADOS < 0 (-0.322) con
una asimetría positiva, en donde los datos tienen mayor concentración a la izquierda del
Con ayuda de la herramienta de Excel determiné los valores que pedían representados en
la siguiente tabla.
Media 9333,85
Mediana 8062
Moda 6855
Desviación
4981,02
estándar
Coeficiente de
0,62
asimetría
Ilustración 5. Tabla de medidas de tendencia central y medidas de dispersión con fórmulas Excel.
donde lo que se buscó realmente fue el coeficiente de varianza, obteniendo otro valor
En donde se puede notar la diferencia entre los valores obtenidos de 0.62 a 0,534.
INTERPRETACIÓN DE RESULTADOS.
Media (US$ 9333,85): Este dato significa que la compra promedio dólares de los clientes
fue de US$9333,85, en otras palabras es como si el total de las compras de todos los clientes
Mediana (US$ 8062): El valor de la compra que se encuentra en el centro de los datos
organizados de mayor a menor, fue de US$ 8062, que corresponde al valor de la mediana,
siendo está otra medida de tendencia central, al igual que la media o el promedio.
Moda(US$ 6855): Podemos interpretar con el valor de la moda, que el valor de la compra
que mayor frecuencia absoluta o en otras palabras, el valor de la compra que más se repitió,
US$4981,02, siendo una medida de dispersión que significa que tanto se aleja del valor
promedio del valor de la compra, que en este caso fue de US$ 9333,85; dicho de forma más
dispersión y también habla de lo alejado o disperso que son las compras con respecto a la
compra promedio, hay una tabla que indica que ese coeficiente va de cero a 1 y en el caso que
el coeficiente de varianza sea mayor que 0,5, Indica que hay una variabilidad muy alta en los
datos de compra. En relación a las variables dadas en la tabla anterior, responda y justifique
los resultados:
3.3.1. Pregunta 3.1 ¿Cuál es la categoría de edades que más realiza compras en
el black-friday?
Según los resultados se puede evidenciar que la categoría de edades que más gasto en el
más compra?
La categoría de edad que más compra es la de 26-35 años y su promedio de gastos fue de
9314,5889701 dólares.
15
3.3.3. Pregunta 3.3 ¿La proporción de hombres que compran es mayor que la de
mujeres?
Con estos resultados se puede concluir que la proporción de hombres respecto a los gastos
MUJERES: 132197
HOMBRE: 405380
16
mujeres?
Con los datos de hombres y mujeres se determinó el promedio de gastos de cada uno es
3.4.1. Pregunta 4.1 Proponga una alternativa para determinar el tamaño de una
PROPUESTA 1.
Datos.
PROPUESTA 2.
Para determinar el tamaño de una muestra esta se puede hacer a partir de dos ecuaciones
grande y otra donde es conocido el tamaño de la población, en este caso tendremos en cuenta
del 95% ya que este valor es usualmente tomado o usado y con un error del 5%. En la
En este caso para un nivel de confianza del 95% el valor de Z es Z=1.96, y los valores de p
3.4.2. Pregunta 4.2 Asumiendo que los datos son normales, calcule un Intervalo
Pues bien, la diferencia de medias está entre 654.01 y 736.01 con una confiabilidad
del 95%. Es decir, que en promedio de compras por hombres es superior a las compras
por las mujeres. Esto es porque los dos límites del intervalo son positivos.
PROPUESTA 2. Para determinar el intervalo de confianza existe una ecuación típica, pero en
este caso es diferente ya que se quiere determinar el intervalo de confianza para la diferencia
Los valores de desviación estándar y valores promedios tanto para hombres como mujeres
Estos son los valores entre los cuales se va a encontrar la diferencia de lo que gastan los
4. Bibliografía y Referencias
Dagdoug, M. (10 de Julio de 2019). Black Friday Sales: Analysis and Prediction.