Está en la página 1de 19

Razonamiento Cuantitativo con Datos

Estadística Descriptiva

Gonzalo Anriquez G.
Gonzalo.anriquez@edu.uai.cl
1
Índice

Módulo 1

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
Estadística Descriptiva
1. Medias de posición: cuartiles, quintiles, deciles y percentiles
2. Tabla de frecuencia con tabla dinámica

Módulo 2

Representaciones gráficas y la tabla dinámica


3. Tabla dinámica
4. Gráficos (Boxplot, barra, torta, histograma)
Repaso clases anteriores

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
En general, en la mayoría de los problemas de
Variables cualitativas negocio, se trabaja con grandes volumenes de
• Nominal datos.
• Ordinal
Para poder entender el comportamiento de los
datos y encontrar patrones, es necesario
sintetizar esta información.
Variables cuantitativas
(Discreta o continua) Las medidas de resumen como su nombre lo
• Intervalos
indica resumen en una sola cifra toda la
• Razón o ratio
información contenida en una variable
Medidas de resumen

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
Medidas de tendencia Media, Mediana, Moda
central
varianza, la desviación
Medidas de dispersión estándar, rango y
coeficiente variación
Medidas de posición Percentiles, cuartiles,
quintiles y deciles
¿Quintiles, deciles?

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
¿A qué se refiere con los
quintiles más altos?

Fuente: https://www.latercera.com/pulso/noticia/casi-la-
mitad-de-quienes-podrian-acceder-a-sacar-nuevo-10-
pertenece-a-los-quintiles-de-mayores-ingresos/
DBU6THQASBEB5OHOFO54AYFZ6E/
¿Quintiles, deciles?

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
“...cuando uno mira la distribución
completa (de la recaudación) se
aprecia que el 70% de la recaudación
por concepto de IVA la paga la clase
media, es decir, los primero nueve
deciles y solamente el 30% lo paga el
decil más alto”.
Medidas de posición

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
• Las medidas de posición reciben ese nombre pues ayudan a comprender, valga la
redundancia, cuál es la posición de una observación con respecto al conjunto total
de observaciones.
• Para ello se divide el conjunto total de observaciones en subgrupos con el mismo
número de datos.
• Las medias de posición más usuales son los percentiles, cuartiles, quintiles y
deciles
Medidas de posición

• Formalmente el percentil de una muestra es un valor tal que al

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
menos de las observaciones están por debajo de ese valor.

• Los cuartiles son un caso particular de los percentiles, con

• Lo mismo ocurre con los quintiles y los deciles… y en este caso los
valores de serían…?
Ejemplo

1. Variable: Estatura

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
2. Para determinar 4 : Cuartiles
posición, primero 5 : Quintiles
debemos ordenar los 10: Deciles
datos 100: percentilles

3. Se dividen los datos, de


acuerdo a los cuantiles
que se quieran analizar
¿Quintiles más altos?

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
¿A qué se refiere con los
quintiles más altos?

Fuente: https://www.latercera.com/pulso/noticia/casi-la-
mitad-de-quienes-podrian-acceder-a-sacar-nuevo-10-
pertenece-a-los-quintiles-de-mayores-ingresos/
DBU6THQASBEB5OHOFO54AYFZ6E/
¿Quintiles, deciles?

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
“...cuando uno mira la distribución
completa (de la recaudación) se
aprecia que el 70% de la recaudación
por concepto de IVA la paga la clase
media, es decir, los primero nueve
deciles y solamente el 30% lo paga el
decil más alto”.
Resumen
Medidas de resumen

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
Medidas de tendencia Media, Mediana, Moda
central
varianza, la desviación
Medidas de dispersión estándar, rango y
coeficiente variación
Medidas de posición Percentiles, cuartiles,
quintiles y deciles
análisis de datos
Herramientas gráficas para el

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
Boxplot

• Es un método estandarizado para

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
representar gráficamente una serie
de datos numéricos a través de sus
cuartiles, el diagrama de caja
muestra a simple vista la mediana y
los cuartiles de los datos.

• Representación visual que describe


varias características importantes al
mismo tiempo, tales como la
dispersión y la simetría
Boxplot
La mediana, destacada en amarillo en
el ejemplo.​

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
Los valores correspondientes al primer
y tercer cuartil (Q1 y Q3)
respectivamente para la variable a
graficar, son los límites de la "caja".

Los "bigotes" (definidos por los
valores Q1 – 1,5*RIC y Q3 + 1,5*RIC)
determinan a partir de qué valores los
puntos son considerados como
atípicos o outliers.

RIC corresponde al
rango intercuartílico, definido
por: RIC= Q3 – Q1.​
Ejemplos

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
Nota: Cuidado con escalas, titulo, que sea visible y comprensible
Torta

Gráficos Circular:

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
• También llamado gráfico de torta, es
utilizado para representar
magnitudes en frecuencias o
porcentajes.

• Un circulo se divide en sectores y


cada sector representa el porcentaje
de cada dato respecto al total de
datos

• El largo de arco (i.e. area) de cada


sector es proporcional a la cantidad
que representa.
Barra

• Representa gráficamente un conjunto de datos o valores formado por barras

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)
rectangulares de longitudes proporcionales a los valores representados son
usados para comparar cantidades de valores en diferentes momentos,
también productos.

• Es una forma de resumir un conjunto de datos por categoría muestra los datos
utilizando varias barras de la misma anchura cada una de las cuales representa
una categoría concreta
Líneas

F a c u l t a d d e I n g e n i e r í a y C i e n c i a s (FIC)

También podría gustarte