Está en la página 1de 3

Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

1. Realice un histograma y explique la forma y la curtosis según el contexto.


La asimetría y curtosis informan sobre la forma de la distribución de una variable. Estas
medidas permiten saber las características de su asimetría y homogeneidad sin necesidad
de representarlos gráficamente.

En nuestro caso se presenta una curtosis grande, y el Apuntamiento mayor a 3 siendo


leptocúrtica. Además, es de asimetría positiva o sesgo a la derecha con 𝑀𝑜 < 𝑀𝑒 < 𝑥̅

2. Calcular: la media, la mediana, la moda, desviación estándar, coeficiente de variación e


interprete los resultados.
Las medidas de tendencia central o medidas de centralización
Nos dan los valores centrales de los datos obtenidos. Las más usuales son: la media, la moda y la
mediana.
Media
La media es el promedio de los datos, que es la suma de todas las observaciones dividida entre el
número de observaciones.
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
5017688378
𝑥̅ =
537577
𝑥̅ = 9333,86
El valor medio de compras (en dólares) de 537577 clientes realizadas en una tienda minorista es de
US$ 9333,86. En promedio un cliente realiza transacciones por un valor de US$ 9333,86 en la
tienda minorista.
Moda
La moda es el valor que ocurre con más frecuencia en un conjunto de observaciones. La media y la
mediana requieren un cálculo, pero la moda se determina contando el número de veces que cada
valor ocurre en un conjunto de datos.
El valor que más frecuentemente se presenta de compras (en dólares) de 537577 clientes realizadas
en una tienda minorista es de US$ 6855.
Mediana
La mediana es el punto medio del conjunto de datos. El valor de este punto medio es el punto en el
cual la mitad de las observaciones está por encima del valor y la otra mitad está por debajo del
valor. La mediana se determina jerarquizando las observaciones y hallando la observación que
ocupe el número [N + 1] / 2 en el orden jerarquizado.
El 50% del valor de compras (en dólares) de 537577 clientes realizadas en una tienda minorista es
menor que o igual a US$ 8062.
Las medidas de dispersión
Las medidas anteriores son de posición y marcan la tendencia que tiene un conjunto de datos dado
a agruparse hacia el centro, pero también se descubrió que los datos extremos podían estar bastante
alejados de esa tendencia central. Medir esa variación respecto a los promedios es un cálculo
importante en el tratamiento estadístico de datos, medidas a las que se les denomina de dispersión
o de variación. La información que arrojan las medidas de tendencia central no siempre
proporcionan conclusiones contundentes frente al conjunto de datos. Dos medidas de dispersión
son precisamente la desviación estándar y el coeficiente de variación.
Desviación Estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están
los datos alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la
desviación estándar de una población, mientras que s se utiliza para representar la desviación
estándar de una muestra.

∑(𝑋 − 𝑥̅ )2
𝜎= √
𝑛

𝜎 = 4981,02
En promedio, el valor de compras (en dólares) de 537577 clientes realizadas en una tienda
minorista se desvía de la media aproximadamente US$ 4981,02.
Coeficiente de Variación
El coeficiente de variación (CoefVar) es una medida de dispersión que describe la variación en los
datos en relación con la media. El coeficiente de variación se ajusta de manera que los valores
estén en una escala sin unidades. Gracias a este ajuste, usted puede utilizar el coeficiente de
variación en lugar de la desviación estándar para comparar la variación de los datos que tienen
unidades diferentes o medias muy diferentes.
𝜎
𝐶𝑜𝑒𝑓𝑉𝑎𝑟 = ∗ 100%
𝑥̅
4981,02
𝐶𝑜𝑒𝑓𝑉𝑎𝑟 = ∗ 100%
9333,86
𝐶𝑜𝑒𝑓𝑉𝑎𝑟 = 53,37 %
Se presenta una variabilidad con respecto a la media del 53,37 % del valor de compras (en dólares)
de 537577 clientes realizadas en una tienda minorista.

También podría gustarte