Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Estadística
Business Analytics
2
Variable: característica
de un objeto o individuo
Datos: conjunto de
valores individuales
asociados con una
variable
Variable
Datos
Business Analytics
3
Tipos de Variables
Categóricas Numéricas
(Cualitativas) (Cuantitativas)
Binarias
(Bernoulli)
Porcentaje
Business Analytics
4
Estructura de Datos (Tidy Dataset)
Las bases de datos usualmente se organizan en casos de análisis (filas) y variables asociadas a los
casos (columnas).
Fuente: https://www.listendata.com/2015/02/excel-formula-convert-data-from-long-to.html
Business Analytics
5
Análisis descriptivo de datos
univariado
Business Analytics
6
Análisis descriptivo variable categórica – nominal
Gráfico de Utilidad del grafico de torta Gráfico de Cuenta de fuel-type
torta o pie barras
gas
Total
diesel
Tablas resumen
fuel-type Recuento
Opinión %
diesel 20
Útil 95%
gas 185
No es útil 5%
Business Analytics
7
Gráfica de Pareto
El principio de Pareto se presenta cuando la mayoría de los elementos un conjunto de datos ocurre en número
pequeño de categrías, mientras que los pocos restantes se distribuyen en una gran cantidad de categorías. A estos
grupos se les denomina “los pocos vitales” y los “muchos triviales” .¹
1. Fuente: Levine, D. M., Berenson, M. L., & Stephan, D. (2016). Statistics for managers using Microsoft Excel
Business Analytics
8
Análisis descriptivo variable numérica
Busca revelar la estructura funcional (de probabilidad) de la variable y sus características (parámetros)
que permitan definir modelos generativos.
Tendencia
• Media o promedio
Tendencia • Mediana
Central
• Moda
Central
• Varianza
• Desviación estándar
Dispersión • Coeficiente de variación
• Curtosis
• Asimetria
• “..iles”: Cuartiles, Deciles, Percentiles
Forma
Fuente: Allende H. y Ahumada S., ILI-280
Business Analytics
9
Varianza Desviación estándar
Cálculo matemático de Transformación de la varianza
dispersión de una variable. para poder interpretarla.
𝒏
𝟏
𝝈𝟐 = (𝒙𝒊 − 𝑿)𝟐 𝟏 𝒏
𝒏 σ= σ𝒊=𝟏(𝒙𝒊 − 𝑿)𝟐
𝒊=𝟏 𝒏𝟏 σ𝒏
σ= 𝒊=𝟏(𝒙𝒊 − 𝑿)𝟐
𝒏
Business Analytics
10
Asimetría Positiva Curva simétrica Asimetría Negativa
Moda < Mediana < Media Media = Mediana = Moda Media < Mediana < Moda
Business Analytics
11
Tablas de distribución
Business Analytics
12
Diagrama de Barras
Representación de las frecuencias absolutas o relativas de una variable.
Business Analytics
13
Histogramas
▪ Se construye a partir de la tabla de
frecuencias.
▪ Representación de las frecuencias
relativas de una variable.
▪ Su figura puede cambiar dependiendo
del ancho de las barras.
▪ Permite analizar la forma de su
distribución.
▪ Permite complementar la información
de Curtosis y Asimetría.
▪ Brinda cierta información sobre sus
estadísticos centrales y de dispersión.
Business Analytics
14
Diagrama de cajas y bigotes
Datos
Extremos
Bigote
Cuartil 3
Mediana
Cuartil 1
Business Analytics
15
Análisis descriptivo de
datos multivariado
Business Analytics
16
Fuente: https://vandalytic.com/la-correlacion-no-implica-causalidad/
Business Analytics
17
Asociaciones Nominal - Nominal
Cuenta de id vida
ecivil Aburrida Excitante Rutinaria Total general
Casado 3,93% 48,92% 47,15% 100,00%
Divorciado 6,76% 43,92% 49,32% 100,00%
No contesta 0,00% 100,00% 0,00% 100,00%
Separado 24,00% 32,00% 44,00% 100,00%
Soltero 5,61% 54,59% 39,80% 100,00%
Viudo 15,45% 36,36% 48,18% 100,00%
Total general 6,47% 47,52% 46,01% 100,00%
¿Qué buscar?
• Si se hicieron porcentajes de filas, buscar desigualdades entre columnas.
• Si se hicieron porcentajes de columnas, buscar desigualdades entre filas.
Business Analytics
18
Asociaciones Nominal – Numérica
Business Analytics
19
Asociaciones Numérica – Numérica
▪ Correlaciones
▪ Gráfico de Dispersión
Diagrama de dispersión del precio y el consumo por
▪ Series de tiempo galón en carretera
$ 50.000
$ 45.000
Gráfico de Dispersión $ 40.000
Business Analytics
20
Asociaciones Numérica – Numérica
0,80
0,60
variable numérica en el eje Y, y 0,50
0,30
0,10
0,00
1 2 3 4 5 6 7 8 9 10 11 12
Mes
Business Analytics
21
Asociaciones Básicas Estadísticas
Categórica Numérica
Tabla dinámica
Categórica Descriptivos divididos
(cruzada)
Numérica Descriptivos divididos Correlación
Business Analytics
22
Asociaciones Básicas Gráficos
Categórica Numérica
Diagrama de Dispersión /
Numérica Caja y bigotes
Gráfica Series de tiempo
Business Analytics
23
Datos Atípicos o
anómalos
Business Analytics
24
Datos atípicos
Son observaciones cuyos valores son muy diferentes a las otras observaciones del
mismo grupo de datos, lo cual, distorsiona el resultado del análisis.
Causas Estrategias
• Errores de recolección de datos. • Remover (individual o en bloque).
• Acontecimientos extraordinarios, • Reemplazar (por el valor correcto, por un
• Valores extremos. percentil, por dominio, por un modelo).
• Causas no conocidas. • Mantener (sin cambios, con
transformaciones).
• Estudiar (reportar sin y con los datos
anómalos, medir la influencia).
Business Analytics
25